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Escuches a Bach o a Bono, la música tiene un papel muy 
significativo en tu vida. ¿Por qué la música despierta distintos 
estados de ánimo? Levitin se sirve de la neurociencia más avanzada 
y de la más rigurosa psicología evolutiva para ofrecernos 
respuestas. 


Recurriendo a las últimas investigaciones y con ejemplos de piezas 
musicales que van desde Mozart, Duke Ellington a Van Halen, 
Levitin desvela multitud de misterios. ¿Tenemos un límite para 
adquirir nuevos gustos musicales? ¿Qué revelan los escáneres 
sobre las respuestas del cerebro a la música? ¿Nuestras 
preferencias musicales se determinan en el útero? ¿Es el placer 
musical diferente de otro tipo de placer? ¿Por qué estamos tan 
emocionalmente unidos a la música que escuchábamos cuando 
éramos adolescentes? 


La música, como el lenguaje, forma parte de lo más profundo de la 
naturaleza humana. En El cerebro y la música, Levitin nos descubre 
una nueva manera de entenderla y su papel en la vida. 


Daniel J. Levitin 


Tu cerebro y la música 


El estudio científico de una obsesión humana 


ePub r1.0 
Titivillus 30.12.16 


más libros en epubgratis.org 


Título original: This is your Brain on Music 
Daniel J. Levitin, 2006 

Traducción: José Manuel Álvarez Flórez 

Primera edición física en castellano: octubre 2008 


Editor digital: Titivillus 
ePub base r1.2 


INTRODUCCIÓN 


AMO LA MÚSICA Y AMO LA CIENCIA: 
¿POR QUÉ QUERRÍA MEZCLAR LAS DOS? 


«Amo la ciencia, y me duele que asuste a tantos o que crean que elegir la ciencia significa 
que no puedes elegir también la compasión o las artes o sobrecogerte ante la naturaleza. La 
ciencia no tiene como objetivo curarnos del misterio, sino reinventarlo y revigorizarlo.» 


ROBERT SAPOLSKY 
Por qué las cebras no tienen úlcera 


En el verano de 1969, cuando tenía once años, compré en una tienda de 
aparatos de alta fidelidad un equipo estéreo. Me costó los cien dólares que 
había ganado limpiando de malas hierbas los jardines de los vecinos aquella 
primavera a setenta y cinco centavos la hora. Pasé largas tardes en mi 
habitación, escuchando discos: Cream, los Rolling Stones, Chicago, Simon 
and Garfunkel, Bizet, Tchaikovski, George Shearing y el saxofonista Boots 
Randolph. No los ponía demasiado alto, al menos en comparación con mis 
tiempos de la universidad, cuando llegué realmente a quemar los auriculares 
por poner el volumen demasiado fuerte, pero el ruido era excesivo para mis 
padres. Mi madre es novelista; escribía a diario en la madriguera que tenía 
justo debajo del vestíbulo y tocaba el piano todas las noches durante una 
hora antes de cenar. Mi padre era un hombre de negocios; trabajaba ochenta 
horas a la semana, cuarenta de ellas en su despacho de casa a última hora 
del día y los fines de semana. Siendo como era un hombre de negocios, me 
hizo una propuesta: me compraría unos auriculares si le prometía utilizarlos 
cuando estuviera en casa. Aquellos auriculares cambiaron para siempre mi 
forma de escuchar música. 

Los nuevos artistas a los que yo estaba escuchando exploraban por 
primera vez la mezcla estéreo. Como los altavoces que venían con mi 


equipo estéreo todo en uno de cien dólares no eran muy buenos, yo no había 
oído nunca con tanta profundidad como con los auriculares: el 
emplazamiento de los instrumentos tanto en el campo izquierda-derecha 
como en el espacio (reverberante) delante-atrás. Para mí, los discos dejaron 
de ser sólo las canciones, y pasaron a ser el sonido. Los auriculares me 
abrieron un mundo de colores sónicos, una paleta de matices y detalles que 
iban mucho más allá de los acordes y la melodía, la letra o la voz de un 
cantante concreto. El ambiente Sur profundo pantanoso de «Green River» 
de Creedence, o la belleza bucólica de espacios abiertos de «Mothers 
Nature's Son» de los Beatles; los oboes de la Sexta de Beethoven (dirigida 
por Karajan), leves y empapados de la atmósfera de una gran iglesia de 
madera y de piedra; el sonido era una experiencia envolvente. Los 
auriculares convirtieron también la música en algo más personal; llegaba de 
pronto del interior de mi cabeza, no del mundo exterior. Esa conexión 
personal fue en el fondo la que me llevó a convertirme en ingeniero de 
grabación y en productor. 

Muchos años después, Paul Simon me explicó que el sonido era lo que 
él buscaba también siempre. «Yo escucho mis grabaciones por el sonido 
que tienen, no por los acordes ni por la letra: mi primera impresión es el 
sonido global.» 

Después del incidente de los auriculares en mi dormitorio dejé la 
universidad y me metí en una banda de rock. Conseguimos llegar a ser lo 
bastante buenos para grabar en un estudio de veinticuatro pistas de 
California con un ingeniero de talento, Mark Needham, que grabaría luego 
discos de gran éxito de Chris Isaac, Cake y Fleetwood Mac. Yo le caí bien, 
probablemente porque era el único que se interesaba por entrar en la sala de 
control para volver a oír cómo sonábamos, mientras los demás estaban más 
interesados en colocarse entre sesiones. Me trataba como a un productor, 
aunque yo no sabía por entonces lo que era eso, y me preguntaba cómo 
quería que sonara la banda. Me enseñó lo diferente que podía ser el sonido 
dependiendo del micrófono, e incluso la influencia que tenía la colocación 
del micrófono. Al principio, no percibía algunas de las diferencias que me 
indicaba, pero me enseñó qué era lo que tenía que escuchar. «Fíjate que 
cuando pongo este micrófono más cerca del amplificador de la guitarra, el 


sonido se hace más lleno, más redondo y más uniforme, pero cuando lo 
coloco más atrás, capta parte del sonido de la habitación, se vuelve más 
espacioso, aunque si lo hago se pierde parte del rango medio.» 

Nuestra banda llegó a ser moderadamente conocida en San Francisco, y 
nuestras grabaciones se emitieron en estaciones de radio de rock locales. 
Cuando se deshizo la banda (debido a las frecuentes tentativas de suicidio 
del guitarrista y al desagradable hábito del vocalista de tomar óxido nitroso 
y cortarse con cuchillas de afeitar) encontré trabajo como productor de otras 
bandas. Aprendí a captar cosas que no había captado nunca: la diferencia 
entre un micrófono y otro, incluso entre una marca de cinta de grabación y 
otra (la cinta Ampex 456 tenía un «golpe» característico en el registro de 
baja frecuencia, Scotch 250 tenía una nitidez característica en las 
frecuencias altas y Agfa 467, una tersura en el registro medio). En cuanto 
supe qué era lo que tenía que escuchar, pude diferenciar la cinta de Ampex 
de la de Scotch o la de Agfa con la misma facilidad con que podía 
diferenciar una manzana de una pera o de una naranja. Ascendí luego de 
nivel y pasé a trabajar con otros grandes ingenieros, como Leslie Ann Jones 
(que había trabajado con Frank Sinatra y Bobby McFerrin), Fred Catero 
(Chicago, Janis Joplin) y Jeffrey Norman (John Fogerty, los Grateful Dead). 
Aunque yo era el productor (la persona a cargo de las sesiones) me sentía 
intimidado por todos ellos. Algunos de esos ingenieros me dejaron 
presenciar sus sesiones con otros artistas, como Heart, Journey, Santana, 
Whitney Houston y Aretha Franklin. Disfruté así de un valiosísimo curso de 
formación al observar cómo interactuaban con los artistas y al hablar de 
matices sutiles sobre cómo una parte de guitarra estaba articulada y cómo se 
había realizado una interpretación vocal. Hablaban de sílabas en una letra, y 
elegían entre diez interpretaciones distintas. Eran capaces de oír tan bien; 
¿cómo ejercitaban el oído para escuchar cosas que los simples mortales no 
podían discernir? 

Llegué a conocer, mientras trabajaba con pequeñas bandas 
desconocidas, a los ingenieros y directores de estudios, y ellos me 
orientaron para que aprendiera a trabajar cada vez mejor. Un día no 
apareció un ingeniero y fui yo quien empalmó varias cintas de grabación 
para Carlos Santana. En otra ocasión, el gran productor Sandy Pearlman 


salió a comer durante una sesión de Blue Oyster Cult y me dejó encargarme 
de terminar la parte vocal. Una cosa llevó a otra, y pasé casi una década 
produciendo grabaciones en California; acabé teniendo la suerte de poder 
trabajar con muchos músicos conocidos. Pero trabajé también con docenas 
de don nadies musicales, gente con mucho talento pero que nunca consiguió 
salir adelante. Empecé a preguntarme por qué algunos músicos llegaban a 
ser muy conocidos mientras otros languidecían en la oscuridad. Me 
pregunté también por qué la música parecía resultar tan fácil para unos y 
para otros no. ¿De dónde procedía la creatividad? ¿Por qué algunas 
canciones nos conmueven tanto y otras nos dejan fríos? Y ¿qué decir del 
papel de la percepción en todo esto, la asombrosa capacidad de los grandes 
músicos e ingenieros para apreciar matices que la mayoría de nosotros no 
percibimos? 

Estos interrogantes me condujeron de nuevo a la universidad en busca 
de respuestas. Cuando aún trabajaba como productor de discos, bajaba en 
coche hasta la Universidad de Stanford dos veces por semana con Sandy 
Pearlman para asistir a las clases de neuropsicología de Karl Pribram. 
Descubrí que la psicología era el campo en el que estaban las respuestas a 
algunas de mis preguntas: preguntas sobre la memoria, la percepción, la 
creatividad y el instrumento común en que se basaban todas ellas: el 
cerebro humano. Pero en vez de encontrar respuestas, salía con más 
preguntas... como suele pasar con la ciencia. Y cada nueva pregunta abría 
mi mente a la percepción de la complejidad de la música, del mundo y de la 
experiencia humana. Como dice el filósofo Paul Churchland, los humanos 
llevan intentando comprender el mundo a lo largo de la mayor parte de la 
historia registrada, y justamente en los últimos doscientos años, nuestra 
curiosidad ha descubierto mucho de lo que la naturaleza nos había 
mantenido oculto: la estructura espaciotemporal, la constitución de la 
materia, las muchas formas de energía, los orígenes del universo, la 
naturaleza de la propia vida con el descubrimiento del ADN, y hace sólo 
cinco años, la cartografía completa del genoma humano. Pero hay un 
misterio que no se ha resuelto: el misterio del cerebro humano y de cómo 
surgen de él las ideas y los sentimientos, las esperanzas y los deseos, el 


amor y la experiencia de la belleza, por no mencionar la danza, el arte 
visual, la literatura y la música. 


¿Qué es la música? ¿De dónde viene? ¿Por qué unas secuencias de sonidos 
nos conmueven tanto, mientras otras (como los ladridos de los perros o los 
patinazos de los coches) molestan a mucha gente? Para algunos, estas 
cuestiones suponen gran parte del trabajo de nuestra vida. Para otros, la idea 
de abordar de ese modo la música parece algo equivalente a estudiar la 
estructura química de un cuadro de Goya, dejando de ver con ello el arte 
que el pintor estaba intentando crear. Un historiador de Oxford, Martin 
Kemp, señala una similitud entre los artistas y los científicos. La mayoría 
de los artistas describen su trabajo como experimentos, como parte de una 
serie de esfuerzos destinados a explorar una preocupación común o a 
establecer un punto de vista. Mi buen amigo y colega William Forde 
Thompson (compositor y especialista en cognición musical de la 
Universidad de Toronto) añade que el trabajo tanto de los científicos como 
de los artistas incluye etapas similares de desarrollo: una etapa creativa y 
exploratoria de «devanarse los sesos», seguida de etapas de comprobación y 
perfeccionamiento que se caracterizan por la aplicación de procedimientos 
establecidos, pero que suelen estar acompañadas de una capacidad creadora 
adicional para la resolución de problemas. Los estudios de los artistas y los 
laboratorios de los científicos comparten también similitudes, con un gran 
número de proyectos en marcha al mismo tiempo, en diversas etapas de 
elaboración. Ambos exigen instrumentos especializados y los resultados 
están (a diferencia de los planos definitivos de un puente colgante o la 
operación de cuadrar el dinero en una cuenta bancaria al final del negocio 
del día) abiertos a interpretación. Lo que artistas y científicos comparten es 
la capacidad de vivir siempre dispuestos a interpretar y reinterpretar los 
resultados de su trabajo. El trabajo de ambos es en último término la 
búsqueda de la verdad, pero consideran que esa verdad es por su propia 
naturaleza contextual y variable, dependiendo del punto de vista, y que las 
verdades de hoy se convierten mañana en tesis repudiadas o en objetos 
artísticos olvidados. Basta pensar en Piaget, Freud o Skinner para encontrar 
teorías que tuvieron vigencia generalizada y que más tarde se desecharon (o 


al menos se revaluaron espectacularmente). En la música, se atribuyó de 
forma prematura a una serie de grupos una vigencia perdurable: se aclamó a 
Cheap Trick como los nuevos Beatles, y durante un tiempo la Rolling Stone 
Encyclopedia of Rock dedicó tanto espacio a Adam and the Ants como a 
U2. Hubo períodos en que no se podía concebir que un día la mayor parte 
del mundo no conociese los nombres de Paul Stookey, Christopher Cross o 
Mary Ford. Para el artista, el objetivo de la pintura o de la composición 
musical no es transmitir una verdad literal, sino un aspecto de una verdad 
universal que, si tiene éxito, seguirá conmoviendo e impresionando a la 
gente a pesar de que cambien los contextos, las sociedades y las culturas. 
Para el científico, el objetivo de una teoría es transmitir «verdad para 
ahora»: reemplazar una verdad vieja, aceptando al mismo tiempo que algún 
día esa categoría será sustituida también por una nueva «verdad», porque 
así es como avanza la ciencia. 

La música es excepcional entre todas las actividades humanas tanto por 
su ubicuidad como por su antigiiedad. No ha habido ninguna cultura 
humana conocida, ni ahora ni en cualquier época del pasado de que 
tengamos noticia, sin música. Algunos de los utensilios materiales más 
antiguos hallados en yacimientos de excavaciones humanas y protohumanas 
son instrumentos musicales: flautas de hueso y pieles de animales estiradas 
sobre tocones de árboles para hacer tambores. Siempre que los humanos se 
reúnen por alguna razón, allí está la música: bodas, funerales, la graduación 
en la universidad, los hombres desfilando para ir a la guerra, los 
acontecimientos deportivos, una noche en la ciudad, la oración, una cena 
romántica, madres acunando a sus hijos para que se duerman y estudiantes 
universitarios estudiando con música de fondo. Y esto se da aún más en las 
culturas no industrializadas que en las sociedades occidentales modernas; la 
música es y era en ellas parte de la urdimbre de la vida cotidiana. Sólo en 
fechas relativamente recientes de nuestra propia cultura, hace unos 
quinientos años, surgió una diferenciación que dividió en dos la sociedad, 
formando clases separadas de intérpretes y oyentes. En casi todo el mundo 
y durante la mayor parte de la historia humana, la música era una actividad 
tan natural como respirar y caminar, y todos participaban. Las salas de 


conciertos, dedicadas a la interpretación de la música, aparecieron hace 
muy pocos siglos. 

Jim Ferguson, al que conozco desde el instituto, es hoy profesor de 
antropología. Es una de las personas más divertidas y más inteligentes que 
Conozco, pero es muy tímido; no sé cómo se las arregla para dar sus cursos. 
Para su tesis doctoral en Harvard, hizo trabajo de campo en Lesotho, una 
pequeña nación rodeada por Suráfrica. Allí estudió e interactuó con los 
aldeanos locales, y se ganó pacientemente su confianza, hasta que un día le 
pidieron que participase en una de sus canciones. Y entonces, en un detalle 
muy propio de él, cuando los sotho le pidieron que cantara, Jim dijo en voz 
baja: «Yo no sé cantar», y era verdad: habíamos estado juntos en la banda 
del instituto y aunque tocaba muy bien el oboe, era incapaz de cantar. A los 
aldeanos esta objeción les pareció inexplicable y desconcertante. Ellos 
consideraban que cantar era una actividad normal y ordinaria que todo el 
mundo realizaba, jóvenes y viejos, hombres y mujeres, no una actividad 
reservada a unos pocos con dones especiales. 

Nuestra cultura, y en realidad nuestro propio lenguaje, establece una 
distinción entre una clase de intérpretes especializados (los Arthur 
Rubinstein, Ella Fitzgerald, Paul McCartney) y los demás, que pagamos por 
oír que los especialistas nos entretengan. Jim sabía que no era gran cosa 
como cantor ni como bailarín, y para él cantar y bailar en público implicaba 
que debía considerarse un experto. La reacción de los aldeanos fue mirarlo 
con perplejidad y decir: «¿¡Qué quieres decir con lo de que no sabes 
cantar!? ¡Tú hablas!». Jim explicó más tarde: «A ellos les resultaba tan 
extraño como si les dijese que no sabía andar o bailar, a pesar de tener dos 
piernas». Cantar y bailar eran actividades naturales en la vida de todos, 
integradas sin fisuras y en las que todos participaban. El verbo cantar en su 
lengua (ho bina), como en muchas otras lenguas del mundo, significa 
también bailar; no hay ninguna distinción, porque se supone que cantar 
entraña movimiento corporal. 

Hace un par de generaciones, antes de la televisión, muchas familias se 
reunían e interpretaban música juntas como diversión. Hoy se insiste mucho 
en la técnica y en la habilidad, y en si un músico es «lo bastante bueno» 
para tocar para otros. La música se ha convertido en una actividad reservada 


a unos cuantos en nuestra cultura, y los demás tenemos que escuchar. La 
industria musical es una de las de mayores en los Estados Unidos, y 
trabajan para ella cientos de miles de personas. Sólo las ventas de álbumes 
aportan 30.000 millones de dólares al año, y esta cifra no tiene en cuenta las 
ventas de entradas para los conciertos, los miles de bandas que tocan en 
locales las noches de los viernes por toda Norteamérica, ni los 30.000 
millones de canciones que se bajaron gratuitamente por el procedimiento de 
compartir archivos en la red en 2005. Los estadounidenses gastan más 
dinero en música que en sexo o en medicinas recetadas. Teniendo en cuenta 
ese consumo voraz, yo diría que la mayoría pueden considerarse oyentes de 
música expertos. Tenemos capacidad cognitiva para detectar notas 
equivocadas, para encontrar música con la que disfrutar, para recordar 
cientos de melodías y para mover los pies al compás de una pieza..., una 
actividad que entraña un proceso de extracción de compás tan complicado 
que la mayoría de los ordenadores no pueden hacerlo. ¿Por qué escuchamos 
música y por qué estamos dispuestos a gastar tanto dinero para escuchar 
música? Dos entradas de conciertos pueden costar fácilmente tanto como lo 
que gasta en alimentación en una semana una familia de cuatro miembros, y 
un CD cuesta más o menos lo mismo que una camisa, ocho barras de pan o 
un servicio telefónico básico durante un mes. Entender por qué nos gusta la 
música y qué obtenemos de ella es una ventana que da acceso a la esencia 
de la naturaleza humana. 


Plantearse interrogantes sobre una capacidad humana básica y omnipresente 
es planteárselos de manera implícita sobre la evolución. Los animales 
desarrollaron evolutivamente formas físicas determinadas como respuesta a 
su entorno, y las características que otorgaban una ventaja para el 
apareamiento se transmitieron a la generación siguiente a través de los 
genes. 

Un aspecto sutil de la teoría darwiniana es que los organismos vivos 
(sean plantas, virus, insectos o animales) coevolucionaron con el mundo 
físico. Dicho de otro modo, mientras que todas las cosas vivas están 
cambiando como reacción al mundo, el mundo también está cambiando en 
respuesta a ellas. Si una especie desarrolló un mecanismo para mantener 


alejado a un predador concreto, sobre la especie de ese predador pesa la 
presión evolutiva bien de desarrollar un medio de superar esa defensa O 
bien de hallar otra fuente de alimentación. La selección natural es una 
carrera armamentista de morfologías físicas que cambian para adaptarse 
unas a otras. 

Un campo científico relativamente nuevo, la psicología evolutiva, 
amplía la idea de evolución de lo físico al reino de lo mental. Cuando yo era 
estudiante en la Universidad de Stanford, mi mentor, el psicólogo cognitivo 
Roger Shepard, decía que no sólo nuestros cuerpos, sino también nuestras 
mentes, son el producto de millones de años de evolución. Nuestras pautas 
de pensamiento, nuestras predisposiciones para resolver problemas de 
determinados modos, nuestros sistemas sensoriales (como por ejemplo 
nuestra Capacidad para ver en color, y los colores concretos que vemos) son 
todos ellos producto de la evolución. Shepard llevaba la cuestión aún más 
allá: nuestras mentes coevolucionaron con el mundo físico, modificándose 
para adaptarse a condiciones en constante cambio. Tres alumnos de 
Shepard, Leda Cosmides y John Tooby de la Universidad de California en 
Santa Bárbara, y Geoffrey Miller, de la Universidad de Nuevo México, 
figuran entre los que están a la vanguardia en este nuevo campo. Los 
investigadores que trabajan en él creen que pueden descubrir muchas cosas 
sobre la conducta humana considerando la evolución de la mente. ¿Qué 
función tuvo la música para la humanidad cuando estábamos evolucionando 
y desarrollándonos? Ciertamente, la música de hace cincuenta mil o cien 
mil años es muy diferente de Beethoven, Van Halen o Eminem. Igual que 
nuestros cerebros han evolucionado, también lo ha hecho la música que 
creamos con ellos, y la música que queremos oír. ¿Evolucionaron vías y 
zonas determinadas de nuestro cerebro específicamente para crear y 
escuchar música? 

Descubrimientos recientes de mi laboratorio y de los de mis colegas 
están demostrando que la música se distribuye por todo el cerebro, en 
contra de la antigua idea simplista de que el arte y la música se procesan en 
el hemisferio derecho, mientras que el lenguaje y las matemáticas se 
procesan en el izquierdo. A través de estudios con individuos que padecen 
lesiones cerebrales, hemos visto pacientes que han perdido la capacidad de 


leer un periódico pero aún pueden leer música, o individuos que pueden 
tocar el piano pero carecen de la coordinación motriz precisa para 
abotonarse la chaqueta. Oír, interpretar y componer música es algo en lo 
que intervienen casi todas las áreas del cerebro que hemos identificado 
hasta ahora, y exige la participación de casi todo el subsistema neuronal. 
¿Podría explicar este hecho la afirmación de que escuchar música ejercita 
otras partes de nuestra mente; que escuchar a Mozart veinte minutos al día 
nos hará más inteligentes? 

Ejecutivos publicitarios, cineastas, comandantes militares y madres 
aprovechan el poder de la música para evocar emociones. Los publicistas 
utilizan la música para hacer que un refresco, una cerveza, un calzado para 
correr o un coche parezcan más atractivos que sus competidores. Los 
directores de cine utilizan la música para explicarnos lo que sienten en 
escenas que de otro modo podrían ser ambiguas, o para intensificar nuestros 
sentimientos en momentos especialmente dramáticos. Imaginemos una 
escena típica de persecución de una película de acción, o en la música que 
podría acompañar a una mujer solitaria que sube por una escalera en una 
vieja mansión sombría. La música se utiliza para manipular nuestras 
emociones y tendemos a aceptar, si es que no a disfrutar directamente, esa 
Capacidad que tiene para hacernos experimentar diversos sentimientos. 
Madres de todo el mundo, y remontándonos hacia atrás en el tiempo todo lo 
que podamos imaginar, han utilizado el canto para dormir a los niños 
pequeños, o para distraerlos de algo que les ha hecho llorar. 


Muchas personas que aman la música aseguran que no saben nada de 
música. He descubierto que muchos de mis colegas que estudian temas 
complejos y difíciles como la neuroquímica o la psicofarmacología no se 
sienten preparados para investigar la neurociencia de la música. ¿Y quién 
puede reprochárselo? Los teóricos de la música manejan una serie arcana y 
enrarecida de términos y reglas tan oscuros como algunos de los campos 
más esotéricos de las matemáticas. Para el que no es músico, esas manchas 
de tinta en una página que nosotros llamamos notación musical podrían ser 
comparables a las anotaciones de la teoría matemática de conjuntos. Hablar 


de tonalidades, cadencias, modulación y transposición puede resultar 
desconcertante. 

Sin embargo, todos esos colegas que se sienten intimidados por esa 
jerga pueden decirme cuál es la música que les gusta. Mi amigo Norman 
White es una autoridad mundial en el hipocampo de las ratas, y en cómo 
recuerdan los diferentes lugares que han visitado. Es muy aficionado al jazz 
y puede hablar como un experto sobre sus artistas favoritos. Puede apreciar 
instantáneamente la diferencia entre Duke Ellington y Count Basie por el 
sonido de la música, y puede incluso distinguir al Louis Armstrong de la 
primera época a la del final. Norm no tiene ningún conocimiento musical en 
el sentido técnico: puede decirme que le gusta una canción determinada, 
pero no puede decirme los nombres de los acordes. Es sin embargo un 
experto en saber lo que le gusta. Eso no tiene nada de excepcional, por 
supuesto. Muchos de nosotros tenemos un conocimiento práctico de cosas 
que nos gustan, y podemos comunicar nuestras preferencias sin tener el 
conocimiento técnico del verdadero experto. Yo sé que prefiero la tarta de 
chocolate de un restaurante al que suelo ir a la tarta de chocolate de la 
cafetería de al lado de mi casa. Pero sólo un chef sería capaz de analizar la 
tarta (descomponer la experiencia gustativa en sus elementos) describiendo 
las diferencias en el tipo de harina, o en la mantequilla, o en el tipo de 
chocolate utilizados. 

Es una lástima que muchas personas se sientan intimidadas por la jerga 
que manejan los músicos, los teóricos de la música y los científicos 
cognitivos. Hay un vocabulario especializado en todos los campos de 
investigación (pruebe a interpretar el informe completo de un análisis de 
sangre de su médico). Pero en el caso de la música, los científicos y los 
especialistas podrían esforzarse un poco más en la tarea de hacer accesible 
su trabajo. Se trata de algo que he intentado conseguir en este libro. El 
abismo antinatural que se ha abierto entre la interpretación musical y la 
audición de música se corresponde con el abismo paralelo que separa a los 
que aman la música (y les encanta hablar de ella) y los que están 
descubriendo cosas nuevas sobre cómo opera. 

Una impresión que mis alumnos suelen confiarme es la de que aman la 
vida y sus misterios y temen que una excesiva educación les robe muchos 


de los placeres sencillos de la vida. Los alumnos de Robert Sapolsky 
probablemente le hayan hecho confidencias parecidas, y yo sentí también la 
misma angustia en 1979, cuando me trasladé a Boston para estudiar música 
en el Berklee College. ¿Y si adoptando un enfoque científico al estudiar la 
música y al analizarla la despojo de sus misterios? ¿Y si llego a saber tanto 
sobre ella que no me proporciona ya placer? 

La música aún sigue ofreciéndome el mismo placer que cuando la oía 
en aquel equipo de alta fidelidad barato con los auriculares. Cuanto más 
llegué a saber sobre la música y sobre la ciencia más fascinantes me 
resultaron, y más capaz me sentí de apreciar a la gente que es realmente 
buena en ambos campos. La música, como la ciencia, ha resultado ser a lo 
largo de los años una aventura, nunca experimentada exactamente del 
mismo modo dos veces. Ha sido para mí una fuente de continuas sorpresas 
y de satisfacción. Resulta que ciencia y música no son tan mala mezcla. 

Este libro trata de la ciencia de la música desde la perspectiva de la 
neurociencia cognitiva, el campo que se halla en la intersección de la 
psicología y la neurología. Analizaré algunos de los estudios más recientes 
que yo y otros investigadores de nuestro campo hemos realizado sobre la 
música, su contenido y el placer que proporciona. Aportan nuevas 
perspectivas de cuestiones profundas. Si todos oímos la música de una 
forma diferente, ¿cómo podemos explicar que algunas composiciones 
puedan conmover a tantas personas, el Mesías de Haendel o «Vincent 
(Starry Starry Night)» de Don McLean, por ejemplo? Por otra parte, si 
todos oímos la música del mismo modo, ¿cómo podemos explicar las 
amplias diferencias de preferencia musical? ¿Por qué el Mozart de un 
individuo es la Madonna de otro? 

En los últimos años se ha profundizado en el conocimiento de la mente 
gracias a un campo en vertiginoso crecimiento, el de la neurociencia, y a 
nuevos enfoques en psicología debidos a las nuevas tecnologías de 
representación del cerebro, a drogas  Capaces de manipular 
neurotransmisores como la dopamina y la serotonina y con ayuda también a 
la simple y vieja actividad científica. Menos conocidos son los avances 
extraordinarios que hemos conseguido en la construcción de modelos de 
cómo se interconectan nuestras neuronas, gracias a la revolución incesante 


de la tecnología informática. Estamos llegando a entender como nunca 
antes habíamos podido sistemas informatizados que existen dentro de 
nuestra cabeza. El lenguaje parece ahora hallarse sustancialmente integrado 
en el cerebro. Hasta la propia conciencia ha dejado ya de estar envuelta de 
forma irremediable en una niebla mística, y ha pasado a ser más bien algo 
que surge de sistemas físicos observables. Pero nadie ha unido todo este 
nuevo trabajo y lo ha utilizado para elucidar lo que es para mí la más bella 
obsesión humana. Analizar la relación entre el cerebro y la música es una 
vía para llegar a entender los misterios más profundos de la naturaleza 
humana. Es por eso que escribí este libro. 

Si comprendemos mejor lo que es la música y de dónde sale, quizá 
podamos comprender mejor nuestras motivaciones, temores, deseos, 
recuerdos e incluso la comunicación en el sentido más amplio. ¿Es escuchar 
música algo parecido a comer cuando tienes hambre, y satisfacer así una 
necesidad? ¿O se parece más a ver una bella puesta de sol o a disfrutar de 
un masaje en la espalda, que activan sistemas de placer sensorial en el 
cerebro? Ésta es la historia de cómo el cerebro y la música 
coevolucionaron: lo que la música puede enseñarnos sobre el cerebro, lo 
que el cerebro puede enseñarnos sobre la música y lo que ambos pueden 
enseñarnos sobre nosotros mismos. 


1 


¿QUÉ ES MÚSICA? 


DEL TONO AL TIMBRE 


¿Qué es música? Para muchos «música» sólo puede significar los grandes 
maestros: Beethoven, Debussy y Mozart. Para otros, «música» es Busta 
Rhymes, Dr. Dre y Moby. Para uno de mis profesores de saxo del Berklee 
College (y para legiones de aficionados al «jazz tradicional») cualquier cosa 
hecha antes de 1940 o después de 1960 no es en realidad música. Yo tenía 
amigos cuando era un crío en los años sesenta que venían a mi casa a oír a 
los Monkees porque sus padres les prohibían oír todo lo que no fuese 
música clásica, y otros cuyos padres sólo les dejaban oír y cantar himnos 
religiosos. Cuando Bob Dylan se atrevió a tocar una guitarra eléctrica en el 
festival folk de Newport en 1965 hubo gente que se fue y muchos de los 
que se quedaron le abuchearon. La Iglesia católica prohibió la música con 
polifonía (más de una pieza musical tocada al mismo tiempo), temiendo que 
eso haría dudar a la gente de la unicidad de Dios. La Iglesia prohibió 
también el intervalo musical de una cuarta aumentada, la distancia entre do 
y fa sostenido y conocido también como tritono (el intervalo de West Side 
Story de Leonard Bernstein en que Toni canta el nombre de «María»). Este 
intervalo se consideraba tan disonante que tenía que haber sido obra de 
Lucifer, y así la Iglesia lo llamó Diabolus in musica. Era el tono lo que 
provocaba la indignación de la Iglesia. Y fue el timbre lo que hizo que 
abucheasen a Dylan. 

La música de compositores de vanguardia como Francis Dhomont, 
Robert Normandeau o Pierre Schaeffer fuerza los límites de lo que la 


mayoría de nosotros consideramos que es música. Yendo más allá del uso 
de melodía y armonía, y hasta más allá del uso de instrumentos, estos 
compositores se valen de grabaciones de diversos objetos, como martillos 
neumáticos, trenes y cataratas de agua. Corrigen luego las grabaciones, 
juegan con el tono y acaban combinándolas en un montaje organizado de 
sonido con el mismo tipo de trayectoria emotiva (la misma tensión y 
liberación) que la música tradicional. Los compositores de esta tradición 
son como los pintores que traspasaron los límites del arte realista y 
representativo: los cubistas, los dadaístas, muchos de los pintores modernos 
desde Picasso a Kandinsky y a Mondrian. 

¿Qué tienen en común básicamente la música de Bach, Depeche Mode 
y John Cage? A un nivel más básico, ¿qué es lo que diferencia «What's It 
Gonna Be?!» de Busta Rhymes o la Sonata Patética de Beethoven de, por 
ejemplo, la serie de sonidos que oyes si te sitúas en medio de Times Square, 
o de los que oyes en las profundidades de un bosque tropical? Según la 
definió en una frase célebre el compositor Edgard Varese: «Música es 
sonido organizado». 

Este libro se propone explicar desde una perspectiva neuropsicológica 
cómo afecta la música a nuestro cerebro, nuestra mente, nuestro 
pensamiento y nuestro espíritu. Pero conviene examinar primero de qué está 
hecha. ¿Cuáles son los componentes básicos fundamentales de la música? 
¿Y cómo la originan cuando están organizados? Los elementos básicos de 
cualquier sonido son intensidad, tono, contorno, duración (o ritmo), tempo, 
timbre, ubicación espacial y reverberación. El cerebro organiza esos 
atributos perceptuales básicos en conceptos de nivel más elevado (igual que 
un pintor dispone las líneas en formas) y entre ellos se incluyen el compás, 
la armonía y la melodía. Cuando escuchamos música, estamos percibiendo 
en realidad atributos o «dimensiones» múltiples. He aquí un breve resumen 
de cuáles son: 


Suele llamarse «tono» a un sonido musical diferenciado. Se utiliza 
también la palabra «nota», pero los científicos reservan esa palabra 
para referirse a algo que está anotado en una página o partitura de 
música. Los dos términos, «tono» y «nota», designan la misma 


entidad en el sentido abstracto, pero la palabra «tono» se refiere a lo 
que oyes y la palabra «nota» a lo que ves escrito en una partitura 
musical. 

«Altura de tono» es una construcción puramente psicológica, 
relacionada tanto con la frecuencia real de un tono particular como 
con su posición relativa en la escala musical. Proporciona la 
respuesta a la pregunta «¿Qué nota es ésta?» («Un do sostenido»). 
Definiré más adelante la frecuencia y la escala musical. 

«Ritmo» se refiere a las duraciones de una serie de notas, y a 
cómo se agrupan en unidades. Por ejemplo, en la «Alphabet Song» 
(lo mismo que «Twinkle, Twinkle Little Star») las notas de la 
canción son todas de igual duración para las letras ABCDEFGHIJK 
(con pausa de igual duración, o silencio, entre G y H), y luego las 
cuatro letras siguientes se cantan con la mitad de duración, o el 
doble de rápido por letra: L M N O (lo que provocó que 
generaciones de escolares se pasasen sus primeros meses creyendo 
que había una letra en el alfabeto llamada ellemmenno). 

«Tempo» es la velocidad global o ritmo de la pieza. 

«Contorno» es la forma global de una melodía, teniendo en 
cuenta sólo la pauta de «arriba» y «abajo» (si una nota sube o baja, 
no cuánto sube o baja). 

«Timbre» es aquello que diferencia un instrumento de otro (por 
ejemplo, la trompeta del piano) cuando se toca con ambos la misma 
nota escrita. Es una especie de color tonal que se produce en parte 
por los armónicos de las vibraciones del instrumento. 

«Intensidad» es un constructo puramente psicológico que se 
relaciona (no linealmente y de modos que no entendemos del todo) 
con la amplitud física de un tono. 

«Ubicación espacial» es de dónde procede el sonido. 

«Reverberación» se refiere a la percepción de lo lejos que está 
de nosotros la fuente del sonido en combinación con lo grande que 
es la habitación o sala de música en la que suena; se denomina a 
menudo entre los legos «eco», y es la cualidad que diferencia la 
amplitud del sonido cuando se canta en una sala de conciertos 


grande del sonido cuando cantas en la ducha. Se infravalora su 
influencia en la transmisión de emociones y en la producción de un 
sonido global agradable. 


Estos atributos son separables. Puede modificarse cada uno de ellos sin 
alterar los demás, lo que permite estudiarlos científicamente de uno en uno, 
que es la razón de que podamos concebirlos como dimensiones. La 
diferencia entre «música» y una serie de sonidos al azar o desordenada está 
relacionada con el modo que tienen de combinarse estos atributos 
fundamentales y las relaciones que establecen entre sí. Cuando estos 
elementos básicos se combinan y relacionan de una forma significativa, 
originan conceptos de orden superior, como «compás», «tonalidad», 
«melodía» y «armonía». 


El compás lo crea el cerebro extrayendo información de las claves 
de ritmo y volumen, y es el modo en que se agrupan los tonos entre 
sí a lo largo del tiempo. Un compás de vals organiza los tonos en 
grupos de tres, una marcha en grupos de dos o de cuatro. 

«Tonalidad» es el orden de importancia entre los tonos en una 
pieza musical; esta jerarquía no existe en el mundo, existe sólo en 
nuestra mente, como consecuencia de nuestras experiencias con un 
estilo musical y con idiomas musicales y con los esquemas mentales 
que todos desarrollamos para entender la música. 

«Melodía» es el tema principal de una pieza musical, la parte 
que cantas con ella, la sucesión de tonos que destacan más en tu 
mente. La noción de melodía varía con los géneros. En la música 
rock, lo característico es que haya una melodía para las estrofas y 
otra para el coro, y las estrofas se diferencian por un cambio en la 
letra y a veces por un cambio de instrumentación. En la música 
clásica, la melodía es un punto de partida para que el compositor 
cree variaciones sobre ese tema, que se pueden utilizar a lo largo de 
toda la pieza de formas diferentes. 

La «armonía» se basa en las relaciones entre la altura de los 
diversos tonos, y los marcos tonales que esos tonos establecen y que 


crean expectativas de lo que llegará a continuación en una pieza 
musical..., expectativas que un compositor hábil puede satisfacer o 
quebrantar con finalidades expresivas y artísticas. Armonía puede 
significar simplemente una melodía paralela a la primaria (como 
cuando armonizan dos cantantes) o puede referirse a una progresión 
de acordes, las agrupaciones de notas que forman un marco y un 
fondo en el que se apoya la melodía. 


La idea de elementos primarios que se combinan para crear arte, y la 
importancia de las relaciones entre esos elementos, se da también en el arte 
visual y en la danza. Los elementos principales de la percepción visual son 
el color (que se puede descomponer en las tres dimensiones de tono, 
saturación y claridad), brillantez, ubicación, textura y forma. Pero un 
cuadro es más que esas cosas: no es sólo una línea aquí y otra allá, o un 
punto de rojo en una parte y un sector de azul en otra. Lo que convierte un 
conjunto de líneas y de colores en arte es la relación entre una línea y otra; 
cómo un color o una forma se hacen eco de otro u otra en una parte distinta 
del cuadro. Esos toques de pintura y esas líneas se convierten en arte 
cuando la forma y la fluidez (cómo se ve arrastrada la mirada a lo largo del 
cuadro) se crean a partir de elementos perceptuales de orden inferior. 
Cuando se combinan armoniosamente acaban dando origen a la perspectiva, 
el primer plano y el plano de fondo, la emoción y otros atributos artísticos. 
Asimismo, la danza no es sólo un mar tempestuoso de movimientos 
corporales sin relación; lo que los integra y complementa es la relación de 
esos movimientos entre sí, lo que aporta una coherencia y una cohesión que 
procesan los niveles superiores del cerebro. Y en la música, lo mismo que 
en el arte visual, se juega no sólo con las notas que se emiten, sino con las 
que no se emiten. Miles Davis hizo una descripción famosa de su técnica de 
improvisación paralela a la descripción que hizo Picasso de cómo utilizaba 
él un lienzo: el aspecto más decisivo del trabajo, decían ambos artistas, no 
eran los objetos en sí, sino el espacio entre los objetos. Miles, en concreto, 
describió la parte más importante de sus solos como el espacio vacío entre 
notas, el «aire» que introducía entre una nota y la siguiente. Saber con 
exactitud cuándo emitir la nota que sigue y dar tiempo al oyente para 


anticiparlo, es un rasgo distintivo del talento de Davis. Resulta 
particularmente notorio en su álbum Kind of Blue. 


Para los que no son músicos, términos como «diatónico», «cadencia» O 
incluso «tonalidad» y «tono» pueden constituir una barrera innecesaria. 
Músicos y críticos parecen vivir a veces tras un velo de términos técnicos 
que pueden parecer pretenciosos. ¿Cuántas veces has leído una crítica de un 
concierto en el periódico y te has encontrado con que no tienes ni idea de lo 
que está diciendo el crítico? «Su appoggiatura creó una incapacidad para 
completar la roulade.» O, «¡Me parece increíble que modulasen hasta do 
sostenido menor! ¡Qué ridículo!» Lo que en realidad queremos saber es si 
la música se interpretó de una forma que conmovió al público. Si la 
cantante pareció encarnar al personaje sobre el que estaba cantando. Tal vez 
quisieses que el crítico comparase la actuación de esa noche con la de la 
noche anterior o con un conjunto diferente. Lo que nos interesaba 
normalmente era la música, no los instrumentos técnicos utilizados. No 
aguantaríamos que el crítico gastronómico de un restaurante se pusiera a 
especular sobre la temperatura exacta a la que el chef añadió zumo de limón 
a una salsa holandesa, ni que un crítico de cine nos hablase de la apertura de 
lente utilizada por el cineasta; no deberíamos aguantarlo tampoco en el caso 
de la música. 

Además, muchos de los que estudian música (incluso musicólogos y 
científicos) discrepan sobre el significado de alguno de esos términos. 
Utilizamos el término «timbre», por ejemplo, para designar el sonido global 
o el color tonal de un instrumento, esa característica indescriptible que 
diferencia a una trompeta de un clarinete aunque estén tocando la misma 
nota escrita, o lo que diferencia tu voz de la de Brad Pitt al pronunciar las 
mismas palabras. Pero la incapacidad para ponerse de acuerdo en una 
definición ha conducido a la comunidad científica a tomar la insólita 
medida de alzar las manos y definir timbre como lo que no es. (La 
Acoustical Society of America lo define como todo lo relacionado con un 
sonido que no es intensidad ni tono. ¡Menuda precisión científica!) 

¿Qué es tono? Esta simple pregunta ha generado centenares de artículos 
científicos y miles de experimentos. Tono es la frecuencia o velocidad de 


vibración de una cuerda, una columna de aire u otra fuente física de sonido. 
Si una cuerda vibra de manera que se mueva hacia delante y hacia atrás 
sesenta veces en un segundo, decimos que tiene una frecuencia de sesenta 
ciclos por segundo. La unidad de medida, ciclos por segundo, suele 
llamarse hercio (abreviado Hz), por Heinrich Hertz, el físico teórico alemán 
que fue el primero que transmitió ondas de radio (teórico hasta la médula, 
cuando le preguntaron qué utilidad práctica podrían tener las ondas de 
radio, parece ser que se encogió de hombros y contestó: «Ninguna»). Si 
tuvieses que intentar remedar el sonido de la sirena de un vehículo de 
bomberos, tu voz recorrería diferentes tonos o frecuencias (al cambiar la 
tensión de tus pliegues vocales), algunos «bajos» y algunos «altos». 

Las teclas de la izquierda del teclado del piano golpean cuerdas más 
gruesas y más largas que vibran a una tasa relativamente lenta. Las de la 
derecha, cuerdas más cortas y más finas que vibran a una tasa más alta. La 
vibración de esas cuerdas desplaza moléculas de aire y las hace vibrar a la 
misma velocidad, es decir, con la misma frecuencia que la cuerda. Estas 
moléculas de aire vibrante son las que llegan a nuestro tímpano, y lo hacen 
moverse hacia dentro y hacia fuera con la misma frecuencia. La única 
información que recibe el cerebro sobre el tono del sonido viene de ese 
movimiento hacia dentro y hacia fuera del tímpano; el oído interno y el 
cerebro tienen que analizar ese movimiento para calcular qué vibraciones 
del mundo exterior hacen moverse de ese modo el tímpano. 

Cuando usamos las teclas más próximas a la izquierda del teclado, 
decimos, por convención, que son sonidos de tono «grave», y los de las 
próximas al lado derecho del teclado que son de tono «agudo». Es decir, los 
sonidos que llamamos «graves» son los que vibran lentamente, y están más 
próximos (en frecuencia de vibración) al sonido de los ladridos de un perro 
grande. Los que llamamos «agudos» son los que vibran rápidamente y están 
más próximos a los débiles ladridos que podría emitir un perro pequeño. 
Pero incluso estos términos, «agudo» y «grave», son culturalmente 
relativos: los griegos hablaban de los sonidos en sentido contrario, porque 
los instrumentos de cuerda que ellos construían tendían a estar orientados 
verticalmente. Las cuerdas más cortas o los tubos de órgano más cortos 
tenían sus partes superiores más próximas al suelo, y se llamaban por ello 


notas «bajas» (como en «baja hasta el suelo»), y las cuerdas y tubos más 
largos (que se elevaban hacia Zeus y Apolo) se llamaban notas «altas». 
«Bajo» y «alto» (lo mismo que «izquierda» y «derecha») son en realidad 
términos arbitrarios que tienen que memorizarse. Algunos autores han 
alegado que «alto» y «bajo» son etiquetas intuitivas, y que lo que llamamos 
sonidos de tono alto proceden de los pájaros (que están subidos a los 
árboles o en el cielo) y lo que llamamos sonidos de tono bajo suelen 
proceder de grandes mamíferos próximos al suelo como los osos o el ruido 
de un terremoto. Pero esto no resulta convincente, ya que hay sonidos bajos 
que vienen también de arriba (pensemos en el trueno) y sonidos altos que 
vienen de abajo (los grillos y las ardillas, las hojas que pisamos). 

Como una primera definición de tono, digamos que es esa cualidad que 
distingue primordialmente el sonido asociado a pulsar una tecla de piano 
frente a otra. 

Pulsar una tecla hace que un macillo golpee una o más cuerdas dentro 
del piano. Al golpearla la desplaza, estirándola un poco, y su elasticidad 
intrínseca hace que vuelva hacia su posición original. Pero excede esa 
posición original, yendo demasiado lejos en la dirección opuesta, y luego 
intenta volver una vez más a su posición original, excediéndose de nuevo, y 
oscila así hacia delante y hacia atrás. Cada oscilación va cubriendo menos 
distancia y llega un momento en que la cuerda dejará por completo de 
moverse. Por eso el sonido que oímos al pulsar una tecla de piano se 
suaviza hasta perderse en la nada. El cerebro traduce la distancia que la 
cuerda recorre con cada oscilación hacia delante y hacia atrás como 
intensidad; la tasa a la que oscila se traduce como altura de tono. Cuanto 
más lejos llega la cuerda, más fuerte nos parece el sonido; cuando casi no se 
desplaza, el sonido parece suave. Aunque pudiese parecer contradictorio, la 
distancia recorrida y la tasa de oscilación son independientes. Una cuerda 
puede vibrar muy deprisa y recorrer bien una gran distancia o una distancia 
pequeña. La extensión que recorre depende de lo fuerte que la pulsemos: 
esto se corresponde con nuestra intuición de que al pulsar algo más fuerte el 
sonido es fuerte. La velocidad a la que vibra la cuerda depende 
principalmente de su tamaño y de lo tensa que esté, no de lo fuerte que se 
haya pulsado. 


Podría parecer que deberíamos limitarnos a decir que tono es lo mismo 
que frecuencia; es decir, la frecuencia de vibración de las moléculas de aire. 
Esto es casi cierto. Cartografiar el mundo físico sobre el mundo mental 
raras veces resulta tan directo. Sin embargo, en los sonidos más musicales, 
tono y frecuencia están estrechamente relacionados. 

La palabra tono alude a la representación mental que un organismo tiene 
de la frecuencia básica de un sonido. Es decir, tono es un fenómeno 
psicológico relacionado con la frecuencia de las moléculas de aire que 
vibran. Con lo de «psicológico» quiero decir que se trata de algo que está 
exclusivamente en nuestra mente, no en el mundo exterior; es el producto 
final de una cadena de acontecimientos mentales que da origen a una 
representación o cualidad mental interna por completo subjetiva. Las ondas 
sonoras en sí mismas (moléculas de aire que vibran con frecuencias 
diversas) no tienen tono. Su movimiento y sus oscilaciones se pueden 
medir, pero hace falta un cerebro humano (o animal) para cartografiarlas 
respecto a esa cualidad interna que llamamos tono. 

Percibimos el color de una forma similar, y fue Isaac Newton quien 
primero se dio cuenta de eso. (Newton, por supuesto, es conocido como el 
descubridor de la teoría de la gravedad, y el inventor, junto con Leibniz, del 
cálculo diferencial. Era, como Einstein, muy mal estudiante, y sus 
profesores se quejaban a veces de su falta de atención. Al final lo echaron 
de la escuela.) 

Newton fue el primero que indicó que la luz es incolora, y que en 
consecuencia el color tiene que producirse dentro de nuestro cerebro. «Las 
ondas en sí —escribió— no tienen color.» Desde su época, hemos llegado a 
saber que las ondas luminosas se caracterizan por diferentes frecuencias de 
oscilación, y cuando impactan en la retina de un observador desencadenan 
una serie de fenómenos neuroquímicos cuyo producto final es una imagen 
mental interior a la que llamamos color. Aunque una manzana pueda 
parecer roja, sus átomos no son rojos. Y del mismo modo, como señala el 
filósofo Daniel Dennett, el calor no está compuesto de pequeñas cositas 
Calientes. 

Un budín sólo tiene gusto cuando yo lo meto en la boca, cuando entra 
en contacto con la lengua. No tiene gusto ni sabor cuando está en la nevera, 


sólo el potencial. Así también, las paredes de mi cocina no son «blancas» 
cuando yo abandono la cocina. Aún tienen sobre ellas pintura, por supuesto, 
pero el «color» sólo se produce cuando interactúan con mis ojos. 

Las ondas sonoras impactan en los tímpanos y en el pabellón auricular 
(las partes carnosas de la oreja), poniendo en marcha una Cadena de 
acontecimientos mecánicos y neuroquímicos cuyo producto final es una 
imagen mental interna a la que llamamos tono. Si cae un árbol en el bosque 
y no hay nadie allí para oírlo, ¿produce un sonido? (El primero que planteó 
esta cuestión fue el filósofo irlandés George Berkeley.) Sencillamente, no: 
sonido es una imagen mental creada por el cerebro en respuesta a moléculas 
que vibran. Del mismo modo, no puede haber tono sin un ser humano o un 
animal presente. Un instrumento de medición adecuado puede registrar la 
frecuencia producida por el árbol cayendo, pero en realidad no hay tono a 
menos que se oiga. 

Ningún animal puede oír un tono por cada frecuencia que existe, del 
mismo modo que los colores que vemos son en realidad una pequeña 
porción del espectro electromagnético. El sonido puede oírse teóricamente 
para vibraciones que van justo de los O ciclos por segundo hasta los 100.000 
o más, pero cada animal oye sólo un subconjunto de los sonidos posibles. 
Los seres humanos que no padecen ningún tipo de pérdida auditiva pueden 
normalmente oír sonidos que van desde los 20 hercios hasta los 20.000. Los 
tonos del extremo bajo suenan como un ruido sordo impreciso o un 
temblor: ése es el sonido que oímos cuando pasa un camión al otro lado de 
la ventana (el motor produce un sonido en torno a los 20 hercios) o cuando 
un coche trucado con un sistema de sonido de primera tiene puestos los 
bailes de bajos realmente fuerte. Algunas frecuencias (las que quedan por 
debajo de los 20 hercios) son inaudibles para los seres humanos, porque los 
mecanismos fisiológicos de nuestros oídos no son sensibles a ellas. 

Que el rango de la audición humana suela ser de 20 hercios a 20.000 no 
significa que el rango de la percepción tónica humana sea el mismo; aunque 
podemos oír sonidos en ese rango completo, no todos son musicales; es 
decir, no podemos asignar sin ambigiúedad un tono a un rango completo. 
Por analogía, los colores en los extremos infrarrojo y ultravioleta del 
espectro carecen de definición comparados con los colores más próximos al 


centro. La figura de la página 64 muestra el rango de los instrumentos 
musicales y la frecuencia asociada con ellos. El sonido de la voz del varón 
medio hablando es de unos 110 hercios, y el de la mujer media, de unos 
220. El zumbido de las luces fluorescentes o de una instalación eléctrica 
defectuosa es de 60 hercios (en América del Norte; en Europa y en países 
con una medida diferente de voltaje/corriente puede ser de 50). El sonido 
que emite una cantante al romper un vaso con la voz podría llegar a ser de 
1.000 hercios. El cristal se rompe porque, como todos los objetos físicos, 
tiene una frecuencia vibratoria intrínseca y natural. Puedes oírla dando al 
vaso un golpecito con el dedo o, si es de cristal fino, recorriendo el borde 
con el dedo mojado en un movimiento circular. Cuando la cantante alcanza 
la frecuencia adecuada (la frecuencia resonante del cristal) hace vibrar a las 
moléculas de éste a su velocidad natural, y el cristal estalla. 

Un piano normal tiene 88 teclas. Los pianos pueden tener en casos muy 
raros unas cuantas teclas extra al fondo y los pianos eléctricos, los órganos 
y los sintetizadores tienen sólo 12 o 24 teclas, pero se trata de casos 
especiales. La nota más baja en un piano normal vibra con una frecuencia 
de 27,5 hercios. Curiosamente, ésta es de forma aproximada la velocidad de 
movimiento que constituye un importante umbral de la percepción visual. 
Una sucesión de fotos fijas (diapositivas) desplegadas a esa velocidad de 
presentación o a una velocidad próxima a ella darán la ilusión de 
movimiento. El cine es una secuencia de imágenes fijas alternando con 
trozos de película negra presentadas a una velocidad (un cuarentaiochoavo 
de segundo) que excede la capacidad de resolución temporal del sistema 
visual humano. Percibimos un movimiento suave y continuo cuando no es 
eso en realidad lo que se nos está mostrando. Si las moléculas vibran en 
torno a esa velocidad oímos algo que suena como un nota continua. Si 
colocaste alguna vez naipes en los radios de la rueda de tu bicicleta cuando 
eras niño, te demostraste a ti mismo un principio relacionado: a velocidades 
lentas, oyes simplemente el click-click-click de la carta golpeando los 
radios. Pero superada cierta velocidad, los clicks se juntan y crean un 
zumbido, una nota que puedes realmente tararear a compás; un tono. 

Cuando se toca esa nota más baja en el piano y vibra a 27,5 hercios, 
para la mayoría de la gente carece del tono distintivo de los sonidos de 


hacia la zona media del teclado. En los extremos más bajo y más alto del 
teclado del piano, las notas suenan borrosas para muchas personas por lo 
que se refiere a su tono. Los compositores lo saben y usan esas notas o las 
evitan según lo que intenten conseguir desde el punto de vista compositivo 
y emotivo. Los sonidos con frecuencias por encima de la nota más alta del 
teclado del piano, en torno a los 6.000 hercios y más, suenan como un 
chillido de tono agudo para la mayoría de la gente. Por encima de los 
20.000 hercios la mayoría de los seres humanos no oyen nada, y a los 
sesenta años de edad la mayoría de los adultos no pueden oír gran cosa por 
encima de unos 15.000 hercios, debido al anquilosamiento de las células 
capilares en el oído interno. Así que cuando hablamos del registro de las 
notas musicales, o de esa parte restringida del teclado del piano que 
transmite la sensación más fuerte de tono, estamos hablando 
aproximadamente de tres cuartas partes de las notas del teclado, entre unos 
55 hercios y unos 2.000. 

El tono es uno de los medios primordiales de transmitir emoción 
musical. Hay una serie de factores que comunican estados de ánimo, 
excitación, calma, amor romántico o peligro, pero el tono figura entre los 
más decisivos. Una sola nota aguda puede transmitir excitación, una sola 
nota grave, tristeza. Cuando las notas se pulsan juntas, se consiguen frases 
musicales más potentes y más matizadas. Las melodías están definidas por 
la pauta o relación de tonos sucesivos a lo largo del tiempo; la mayoría de la 
gente no tiene ningún problema para identificar una melodía que se 
interprete en una tonalidad más alta o más baja que aquella en que la oyeron 
anteriormente. De hecho, muchas melodías no tienen un tono inicial 
«correcto», flotan libres en el espacio, empezando en cualquier parte. 
«Cumpleaños Feliz» es un ejemplo. Así que una forma de pensar en una 
melodía es considerarla como un prototipo abstracto que se deriva de 
combinaciones específicas de tonalidad, tempo, instrumentación, etc. Una 
melodía es un objeto auditivo que mantiene su identidad a pesar de las 
transformaciones, igual que una silla mantiene su identidad aunque la 
traslades de un lugar a otro de la habitación, la pongas patas arriba o la 
pintes de rojo. De modo que si oyes, por ejemplo, una canción tocada más 
fuerte de lo que estás acostumbrado a oírla, sigues identificándola pese a 


todo como la misma canción. Lo mismo se cumple respecto a los cambios 
en los valores tónicos absolutos de la canción, que pueden modificarse 
siempre que se mantengan iguales las distancias relativas entre ellos. 

El concepto de valores tónicos relativos es fácil de ver en nuestro modo 
de hablar. Cuando le haces a alguien una pregunta, subes espontáneamente 
la voz elevando la entonación al final de la frase, para indicar que estás 
preguntando. Pero no intentas que la elevación de la voz se atenga a un tono 
específico. Basta con que acabes la frase con un tono un poco más alto que 
como la empezaste. Esto es una convención (aunque no en todas las 
lenguas, es algo que se ha de aprender), y los lingiistas la conocen como 
una clave prosódica. Hay convenciones similares para la música escrita en 
la tradición occidental. Ciertas secuencias de tonos evocan calma, otras, 
excitación. La base cerebral de este efecto se debe primordialmente al 
aprendizaje, del mismo modo que aprendemos que una entonación creciente 
indica una pregunta. Todos tenemos una capacidad innata para aprender las 
distinciones lingúísticas y musicales de la cultura en la que hayamos 
nacido, y la experiencia con la música de esa cultura conforma nuestros 
Canales neuronales para que acabemos interiorizando una serie de reglas 
comunes a esa tradición musical. 

Los diferentes instrumentos utilizan partes distintas del registro de tonos 
disponibles. El piano es el instrumento que tiene un registro más amplio, 
como se puede ver en la ilustración de la página 64. Los otros instrumentos 
utilizan un subconjunto de los tonos disponibles, y esto influye en el uso de 
esos instrumentos para comunicar emoción. El flautín, con su sonido de 
tono agudo, estridente y como de pájaro, tiende a evocar estados de ánimo 
felices y despreocupados independientemente de las notas que se toquen en 
él. Por esa razón, los compositores tienden a utilizarlo para música feliz, o 
estimulante, como en la marcha de Sousa. Asimismo, Prokofiev utiliza la 
flauta en Pedro y el lobo para representar al pájaro, y la trompa de pistones 
para indicar al lobo. La individualidad de los personajes se expresa en 
Pedro y el lobo con los timbres de diferentes instrumentos y cada uno tiene 
un leitmotiv, una frase o figura melódica asociada que acompaña a la 
reaparición de una idea, una persona o una situación. (Es algo que se da en 
especial en el drama musical wagneriano.) Un compositor que elige 


secuencias con un tono supuestamente triste sólo se las asignaría al flautín 
si estuviese intentando ser irónico. Los sonidos graves y pesados de la tuba 
o del contrabajo suelen utilizarse para evocar solemnidad, gravedad o peso. 

¿Cuántos tonos únicos hay? Como el tono procede de un continuo (las 
frecuencias migratorias de moléculas) hay técnicamente un número infinito 
de tonos: por cada par de frecuencias que menciones, siempre podrías 
encontrar una entre ellas, y teóricamente existiría un tono distinto. Pero no 
todos los cambios de frecuencia producen una diferencia de tono apreciable, 
lo mismo que añadir un grano de arena a tu mochila no cambia 
perceptiblemente su peso. Así que no todos los cambios de frecuencia 
tienen utilidad musical. No todos tenemos la misma capacidad para detectar 
pequeños cambios de frecuencia; la formación puede ayudar, pero hablando 
en términos generales, la mayoría de las culturas no utilizan distancias 
mucho más pequeñas que un semitono como base de su música, y la 
mayoría de las personas no pueden percibir de modo fidedigno cambios 
más pequeños que aproximadamente una décima de semitono. 

La capacidad para apreciar diferencias de tono depende de la fisiología, 
y varía de un animal a otro. La membrana basilar del oído interno humano 
tiene células capilares selectivas respecto a la frecuencia que sólo se activan 
con una gama de frecuencias determinada. Están distribuidas a lo largo de 
la membrana siguiendo un orden que va de frecuencias bajas a altas; los 
sonidos de frecuencia baja excitan las células capilares de un extremo de la 
membrana basilar, los de frecuencia media excitan las de la zona media y 
los de alta frecuencia, las del otro extremo. Podemos imaginar que la 
membrana contiene un mapa de tonos diferentes muy parecido al teclado de 
un piano colocado sobre ella. Como los diferentes tonos están extendidos 
por la topografía superficial de la membrana, a eso se le llama un mapa 
tonotópico. 

Los sonidos, una vez que entran en el oído, pasan por la membrana 
basilar, donde se activan células capilares determinadas, según la frecuencia 
de los sonidos. La membrana es como una lámpara de detección de 
movimiento en el jardín; la actividad en una parte determinada de la 
membrana hace que ésta envíe una señal eléctrica al córtex auditivo. El 
córtex auditivo tiene también un mapa tonotópico, con tonos que van de 


bajos a altos extendidos a lo largo de la superficie cortical. En este sentido, 
el cerebro contiene un «mapa» de diferentes tonos, y diferentes zonas del 
cerebro responden a diferentes tonos. El tono es tan importante que el 
cerebro lo representa directamente; a diferencia de lo que sucede con casi 
cualquier otro atributo musical, podríamos colocar electrodos en el cerebro 
y ser capaces de determinar qué tonos se estaban interpretando para una 
persona sólo viendo la actividad cerebral. Y aunque la música se basa en 
relaciones de tono más que en valores tónicos absolutos, a lo que el cerebro 
presta atención a lo largo de sus diversas etapas de procesamiento es, 
paradójicamente, a estos valores tónicos absolutos. 


Una «escala» no es más que un subconjunto del número teóricamente 
infinito de tonos, y cada cultura selecciona los que están basados en la 
tradición histórica O lo hace de una forma un tanto arbitraria. Los tonos 
específicos elegidos son luego consagrados como parte de ese sistema 
musical. Esas son las letras que vemos en la figura anterior. Los nombres 
«A», «B», «C», etc., son etiquetas arbitrarias que asociamos con 
frecuencias determinadas. En la música occidental (la música de la tradición 
europea) estos tonos son los únicos tonos «legales»; la mayoría de los 
instrumentos están diseñados para tocar esos tonos y no otros. 
(Instrumentos como el trombón y el violonchelo son una excepción, porque 
pueden deslizarse entre notas; los que tocan el trombón, el violonchelo, el 
violín, etc., pasan mucho tiempo aprendiendo a oír y producir las 
frecuencias precisas necesarias para cada una de las notas legales.) Los 
sonidos intermedios se consideran errores («desentonar») a menos que se 
utilicen para lograr entonación expresiva (tocar a propósito algo 
desentonado, brevemente, para añadir tensión emotiva) o en el paso de un 
tono legal a otro. 

«Sintonía» es la relación precisa entre la frecuencia de un tono que se 
está tocando y una unidad de medición estándar, o entre dos o más tonos 
que se están tocando al mismo tiempo. Los músicos orquestales que 
«afinan» o «sintonizan» antes de una interpretación están sincronizando sus 
instrumentos (que varían espontáneamente en su sintonía porque la madera, 
el metal, las cuerdas y otros materiales se expanden y contraen con los 


cambios de temperatura y de humedad) a una frecuencia estándar, o a veces 
no a una estándar, sino entre ellos. Los músicos expertos modifican a 
menudo la frecuencia de tonos mientras están tocando con propósitos 
expresivos (salvo, por supuesto, en instrumentos de tono fijo como los 
teclados y los xilófonos); tocar una nota un poco más alto o más bajo de su 
valor nominal puede transmitir emoción cuando se hace con habilidad. Los 
músicos expertos que tocan juntos en grupos modificarán también el tono 
de las notas que tocan para sintonizarlas con las de los otros músicos, en 
caso de que uno o más de ellos se desvíe de la sintonía estándar durante la 
interpretación. 

Los nombres de las notas en la música occidental son do - re - mi - fa - 
sol - la - si - do (este sistema se utiliza como letra en la canción de Rodgers 
y Hammerstein «Do-Re-Mi» de The Sound of Music: «Do, a deer, a female 
deer, Re, a drop of golden sun...»). A medida que las frecuencias se hacen 
más altas, van sucediéndose los nombres de las letras, en el primer sistema; 
B una frecuencia más alta que A (y por tanto un tono más alto) y C una más 
alta que A o B. Después de G, los nombres de las notas empiezan de nuevo 
en A. Las notas del mismo nombre tienen frecuencias que son múltiplos 
entre sí. Una de las diversas notas que llamamos A tiene una frecuencia de 
55 hercios y todas las otras notas que llamamos A tienen dos, tres, cuatro, 
cinco veces esa frecuencia (o la mitad). 

Se trata de una cualidad fundamental de la música. Los nombres de las 
notas se repiten por un fenómeno perceptivo que se corresponde con la 
duplicación y la división por la mitad de las frecuencias. Cuando 
duplicamos o dividimos por dos una frecuencia, acabamos con una nota que 
suena notoriamente similar a aquella con la que empezamos. Esta relación, 
una proporción de frecuencia de dos/uno o uno/dos, se denomina la octava. 
Es tan importante que, a pesar de las grandes diferencias que existen entre 
las culturas musicales (la india, la balinesa, la europea, la del Oriente 
Próximo, la china, etc.), todas las que conocemos tienen la octava como la 
base de su música, aunque ésta tenga poco más en común con las otras 
tradiciones musicales. Este fenómeno conduce a la idea de circularidad en 
la percepción tónica, y es similar a la circularidad en los colores. Aunque el 
rojo y el violeta se encuentran en extremos opuestos del continuo de 


frecuencias visibles de la energía electromagnética, las vemos como 
preceptivamente similares. Lo mismo sucede en la música, de la que suele 
decirse que tiene dos dimensiones, una que explica que los tonos aumentan 
de frecuencia (y suenan más y más alto) y otra que explica la sensación que 
tenemos de que hemos vuelto a casa cada vez que duplicamos la frecuencia 
de una nota. 

Cuando hombres y mujeres hablan al unísono, sus voces están 
normalmente separadas una octava, aunque intenten hablar con los mismos 
tonos exactos. Los niños hablan en general una octava o dos más alto que 
los adultos. Las dos primeras notas de la melodía de Harold Arlen 
«Somewhere Over the Rainbow» (de la película El mago de Oz) hacían una 
octava. En «Hot Fun in the Summertime» de Sly and the Family Stone, Sly 
y los cantantes que lo acompañan cantan en octavas durante el primer verso 
de la estrofa «End of the spring and here she comes back». A medida que 
aumentamos las frecuencias tocando las notas sucesivas en un instrumento, 
tenemos una sensación muy fuerte de que cuando llegamos a una 
duplicación de frecuencia, hemos vuelto otra vez a «casa». La octava es tan 
básica que incluso algunas especies animales (los monos y los gatos, por 
ejemplo) muestran equivalencia de octava, la capacidad para tratar como 
similares, lo mismo que los humanos, notas separadas por esta cuantía. 

Un «intervalo» es la distancia entre dos notas. La octava de la música 
occidental está subdividida en doce notas (logarítmicamente) espaciadas 
por igual. El intervalo entre la y si (o entre do y re) es lo que se llama un 
tono o paso completo. (Este último término es confuso, porque llamamos 
tono a cualquier sonido musical; para evitar la ambigivedad utilizaré «paso 
completo».) La división más pequeña de nuestra escala occidental corta por 
la mitad perceptualmente ese paso completo: es lo que se llama un 
semitono, que es un doceavo de una octava. 

Los intervalos son la base de la melodía, mucho más que los tonos 
concretos de las notas; el proceso de la melodía es relacional, no absoluto, 
lo que quiere decir que definimos una melodía por sus intervalos, no por las 
notas concretas que utilizamos para crearlos. Cuatro semitonos forman 
siempre el intervalo conocido como una tercera mayor, independientemente 
de si la primera nota es un la o un sol o cualquier otra nota. He aquí un 


cuadro de los intervalos que se conocen en nuestro sistema musical 
(occidental): 


Distancia de Nombre de intervalo 
semitonos 


unísono 
segunda menor 
segundo mayor 
tercera menor 
tercera mayor 
cuarta justa 
cuarta aumentada, quinta disminuida, o tritono 
quinta justa 
sexta menor 
sexta mayor 
séptima menor 
séptima mayor 
octava 
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El cuadro podría continuar: trece semitonos es una novena menor, catorce 
semitonos es una novena mayor, etc., pero sus nombres sólo se usan en 
realidad en análisis más avanzados. Los intervalos de cuarta justa y quinta 
justa se llaman así porque tienen un sonido particularmente agradable para 
muchas personas, y desde los antiguos griegos esta característica especial 
de la escala estará en el corazón de toda la música. (No hay ninguna «quinta 
imperfecta», éste es justamente el nombre que damos al intervalo.) Ignora la 
cuarta justa y la quinta justa o utilízalas en todas las frases, han sido la 
columna vertebral de la música durante cinco mil años como mínimo. 
Aunque las áreas del cerebro que reaccionan a tonos individuales han 
sido cartografiadas, aún no hemos conseguido hallar la base neurológica de 
la codificación de las relaciones tonales; sabemos qué sector del córtex 
participa en la audición de las notas do y mi, por ejemplo, y fa y la, pero no 
sabemos cómo o por qué ambos intervalos se perciben como una tercera 
mayor, o los circuitos neurales que crean esta equivalencia perceptual. Esas 


relaciones deben establecerse mediante procesos cognitivos del cerebro que 
aún comprendemos mal. 

Si hay doce llamadas notas dentro de una octava, ¿por qué sólo hay 
siete sílabas do-re-mi-fa-sol-la-si (o letras)? Después de siglos viéndose 
obligados a comer con los sirvientes y a utilizar la entrada de atrás del 
castillo, debe de ser sólo una invención de los músicos para hacer sentir a 
los que no lo son como unos ineptos. Las cinco notas adicionales tienen 
nombres compuestos, como «mi bemol» y «fa sostenido». No hay ninguna 
razón para que el sistema tenga que ser tan complicado, pero es el sistema 
que tenemos. 

Se aclara un poco la cuestión si examinamos el teclado de un piano. 
Hay en él teclas blancas y teclas negras espaciadas en un orden irregular: 
unas veces hay dos teclas blancas adyacentes, y otras veces tienen entre 
ellas una tecla negra. Sean las teclas blancas o negras, la distancia 
perceptual de una tecla adyacente a la siguiente siempre es de un semitono, 
y una distancia de dos teclas es siempre un paso completo o tono. Esto se 
aplica a muchos instrumentos occidentales; la distancia entre un traste de 
una guitarra y el siguiente es también un semitono, y al presionar o soltar 
teclas adyacentes en instrumentos de viento de madera (como el clarinete o 
el oboe) cambia característicamente el tono en un semitono. 

Las teclas blancas se llaman A, B, CG, D, E, F y G. Las notas intermedias 
(las teclas negras) son las que tienen nombres compuestos. La nota entre A 
y B se llama bien A sostenido o bien B bemol, y, salvo en análisis o 
discusiones musicales teóricas oficiales, los dos términos son 
intercambiables. (De hecho, esta nota podría llamarse también C doble 
bemol y, del mismo modo, A podría llamarse G doble sostenido, pero éste 
es un uso aún más teórico.) Sostenido significa aguda o alta y bemol 
significa grave o baja. B bemol es la nota un semitono más baja que B; A 
sostenido es la nota un semitono más alta que A. En el sistema paralelo do- 
re-mi, marcan esos distintos tonos sílabas únicas: di y ra indican, por 
ejemplo, el tono entre do y re. 

Las notas de nombres compuestos no son ni mucho menos ciudadanas 
musicales de segunda clase. Son igual de importantes, y algunas canciones 
y algunas escalas las utilizan de forma exclusiva. Por ejemplo, el principal 


acompañamiento de «Superstition» de Stevie Wonder sólo se toca con las 
teclas negras del teclado. Las doce teclas juntas, más sus primas repetidas 
con una o más octavas de separación, son los componentes básicos 
fundamentales de la melodía, en todas las canciones de nuestra cultura. 
Todas las canciones que conoces, desde «Deck the Halls» a «Hotel 
California», desde «Ba Ba Black Sheep» al tema de Sexo en Nueva York, 
están compuestas combinando estos doce tonos y sus octavas. 

Para aumentar la confusión, los músicos utilizan también los términos 
bemol y sostenido para indicar si alguien está desentonando; si el músico 
toca la nota un poco demasiado alta (pero no tanto como para hacer la nota 
siguiente de la escala) decimos que la nota que se está tocando es sostenida, 
y si el músico toca la nota demasiado baja decimos que la nota es bemol. 
Por supuesto, un músico puede estar desentonando sólo ligeramente y nadie 
se daría cuenta. Pero cuando el músico desentona más (digamos que de un 
cuarto a un medio de la distancia entre la nota que estaba intentando tocar y 
la siguiente) la mayoría podemos normalmente darnos cuenta. Esto se nota 
sobre todo cuando hay más de un instrumento tocando y la nota 
desentonada que oímos choca con las que están tocando simultáneamente 
los otros músicos. 

Los nombres de los tonos están asociados con valores de frecuencia 
concretos. Nuestro sistema actual se llama A440 porque la nota que 
llamamos A, que está en medio del teclado del piano, se ha fijado para tener 
una frecuencia de 440 hercios, lo cual es del todo arbitrario. Podemos fijar 
A a cualquier frecuencia, por ejemplo a 439, 444, 424 o 314.159; en la 
época de Mozart se utilizaron unidades diferentes a las de hoy. Algunas 
personas afirman que las frecuencias han de ser exactas, porque afectan al 
sonido global de una pieza musical y al sonido de los instrumentos. Led 
Zeppelin solían afinar sus instrumentos sin atenerse a la medida moderna 
A440 para dar a su música un sonido especial, y quizá para vincularla con 
las canciones populares infantiles de Europa que inspiraron muchas de sus 
composiciones. Hay puristas que insisten en escuchar música barroca 
interpretada con instrumentos de la época, porque los instrumentos tienen 
un sonido diferente y también porque están diseñados para tocar la música 
en su afinación original, algo que los puristas consideran importante. 


Podemos fijar los tonos donde queramos, porque lo que define la 
música es una serie de relaciones tonales. Las frecuencias específicas de las 
notas pueden ser arbitrarias, pero la distancia de una frecuencia a la 
siguiente (y por tanto de una nota a la siguiente en nuestro sistema musical) 
no lo es en absoluto. Cada nota de nuestro sistema musical está espaciada 
equitativamente para nuestro oído (no necesariamente para los oídos de 
otras especies). Aunque no haya ningún cambio equivalente en ciclos por 
segundo (hercios) cuando ascendemos de una nota a la siguiente, la 
distancia entre cada nota y la siguiente tiene un sonido equivalente. ¿Cómo 
puede ser esto? La frecuencia de cada nota en nuestro sistema es 
aproximadamente un seis por ciento mayor que la de la precedente. Nuestro 
sistema auditivo es sensible tanto a cambios relativos como a cambios 
proporcionales de sonido. Así, cada aumento de frecuencia del seis por 
ciento nos da la impresión de que hemos aumentado el tono igual que la 
última vez. 

La idea de cambio proporcional se entiende mejor si pensamos en 
pesos. Si vas a un gimnasio y quieres aumentar el peso que levantas y pasar 
de las pesas de 2 kilos a las de 20, con 2 kilos más por semana no 
conseguirás una equivalencia en la cantidad de peso levantado. Cuando 
después de una semana levantando 2 kilos pases a 4, estarás duplicando el 
peso; la semana siguiente, cuando pases a 6, será una vez y media más el 
peso que levantabas antes. Un espaciado equivalente (para dar a tus 
músculos un incremento de peso similar cada semana) consistiría en añadir 
un porcentaje constante del peso de la semana anterior en cada aumento. 
Por ejemplo, podrías decidir añadir un cincuenta por ciento cada semana, y 
pasarías entonces de 2 kilos a 3, luego a 4,5, luego a 6,25 y así 
sucesivamente. El sistema auditivo funciona del mismo modo, y por esa 
razón nuestra escala está basada en una proporción: cada nota es un seis por 
ciento más alta que la anterior, y al aumentar un seis por ciento en cada 
paso doce veces, acabamos duplicando la frecuencia original (la proporción 
concreta es la raíz 12 de dos=1,059463...). 

Las doce notas de nuestro sistema musical se denominan escala 
cromática. Una escala es simplemente un conjunto de tonos musicales que 


han sido elegidos para ser diferenciables entre sí y para ser utilizados como 
base en la construcción de melodías. 

En la música occidental raras veces utilizamos todas las notas de la 
escala cromática para componer; utilizamos en realidad un subconjunto de 
siete (o con menos frecuencia, cinco) de esas doce notas. Cada uno de esos 
subconjuntos es en sí mismo una escala, y el tipo de escala que utilizamos 
influye mucho en el sonido global de una melodía, y en sus cualidades 
emotivas. El subconjunto más común de siete notas utilizado en la música 
occidental se denomina la escala mayor, o modo jónico (un reflejo de sus 
antiguos orígenes griegos). Como todas las escalas, puede empezar en 
cualquiera de las doce notas, y lo que la define no es la pauta específica o 
relación de distancia entre cada nota y la siguiente. En toda escala mayor, la 
pauta de intervalos (distancias tonales entre tonalidades sucesivas) es: tono 
entero, tono entero, semitono, tono entero, tono entero, tono entero, 
semitono. 

Las notas de la escala mayor son, empezando en do, do-re-mi-fa-sol-la- 
si-do, todas notas blancas en el teclado del piano. Las demás escalas 
mayores exigen una o más notas negras para mantener la pauta tono 
entero/semitono necesaria. El tono inicial se llama también tónica de la 
escala. 

El emplazamiento concreto de los dos semitonos de la secuencia de la 
escala mayor es crucial; no se trata sólo de que defina la escala mayor y la 
diferencie de las otras escalas, sino que es un ingrediente importante de 
expectativas musicales. Los experimentos han demostrado que tanto los 
niños pequeños como los adultos aprenden y memorizan mucho mejor 
melodías extraídas de escalas con distancias desiguales como ésta. La 
presencia de los dos semitonos, y sus posiciones concretas, orientan al 
oyente aculturado y experimentado hacia dónde estamos en la escala. Todos 
somos expertos en saber, cuando oímos un si en la tonalidad de do (es decir, 
cuando los tonos se están extrayendo primariamente de la escala do mayor) 
que es la séptima nota (o «grado») de esa escala, y que está a sólo un 
semitono por debajo de la tónica, aunque la mayoría de nosotros no 
sepamos nombrar las notas, y puede que no sepamos siquiera lo que es un 
grado de escala o una tónica. Hemos asimilado la estructura de esta escala y 


de otras al oír música y exponernos de forma pasiva (más que guiados 
teóricamente) a ella a lo largo de nuestra vida. No se trata de un 
conocimiento innato, sino que se adquiere a través de la experiencia. 
Tampoco necesitamos aprender cosmología para saber que el sol sale todas 
las mañanas y se oculta por la noche: hemos aprendido esa secuencia de 
acontecimientos a través de una exposición primordialmente pasiva a ellos. 

Diferentes pautas de tonos y semitonos dan origen a escalas alternativas, 
la más común de las cuales (en nuestra cultura) es la escala en modo menor. 
Hay una escala en modo menor que, como la escala en do mayor, utiliza 
sólo las notas blancas del teclado del piano: la escala en la menor. Los tonos 
para esa escala son la - si - do - re - mi - fa - sol - la. (Porque utiliza el 
mismo conjunto de tonos, pero en un orden diferente, la menor se dice que 
es la «escala relativa menor de la escala en do mayor».) La pauta de tonos 
enteros y medios tonos es diferente de la escala en modo mayor: entero - 
medio - entero - entero - medio - entero - entero. Fíjate en que la ubicación 
de los semitonos es muy diferente que en la escala mayor; en las escalas en 
modo mayor, hay un semitono justo antes de la tónica que «lleva» a la 
tónica, y otro justo antes del cuarto grado de la escala. En la escala menor, 
los semitonos están antes del tercer grado de la escala y antes del sexto. Hay 
aún un impulso cuando estamos en esta escala de volver a la raíz, pero los 
acordes que crea este impulso tienen una trayectoria emotiva y un sonido 
muy distintos. 

Ahora podrías muy bien preguntar: si estas dos escalas utilizan 
exactamente el mismo conjunto de tonos, ¿cómo sé en cuál estoy? Si un 
músico está tocando las teclas blancas, ¿cómo sé si está tocando la escala de 
la menor o la escala de do mayor? La respuesta es que (sin que tengamos 
conciencia de ello) nuestros cerebros están siguiendo el rastro de cuántas 
veces se tocan notas concretas, dónde aparecen en forma de compases 
fuertes frente a débiles y cuánto duran. El cerebro deduce a través de un 
proceso cognitivo en qué tonalidad están basándose esas propiedades. Éste 
es otro ejemplo de algo que la mayoría de nosotros podemos hacer incluso 
sin formación musical, y sin lo que los psicólogos llaman conocimiento 
declarativo: la capacidad de hablar sobre ello; pero a pesar de nuestra falta 
de educación musical formal, sabemos qué fue lo que el compositor se 


propuso utilizar como centro tonal, o tonalidad, de la pieza, y nos damos 
cuenta de cuándo nos hace volver a la tónica, o de cuándo deja de hacerlo. 
El medio más simple de establecer una tonalidad es, pues, tocar la tónica 
varias veces, tocarla alto, y tocarla larga. E incluso si un compositor piensa 
que está componiendo en do mayor, si hace a los músicos tocar la nota la 
una y otra vez, tocarla alto y tocarla largo; si el compositor empieza la pieza 
en un la y la termina en un la, y si evita, además, el uso de do, lo más 
probable es que la audiencia, los músicos y los teóricos musicales decidan 
que la pieza está en la menor, aunque ése no fuese el propósito del 
compositor. En las tonalidades musicales, como en las multas por exceso de 
velocidad, lo que cuenta es lo que se ha hecho, no la intención. 

Por razones que son principalmente culturales, tendemos a asociar las 
escalas en modo mayor con emociones felices o triunfales, y las compuestas 
en modo menor con emociones de tristeza o de derrota. Algunos estudios 
han indicado que esas asociaciones podrían ser innatas, pero el hecho de 
que no sean culturalmente universales indica, como mínimo, que cualquier 
tendencia innata puede ser superada por exposición a asociaciones 
culturales específicas. La teoría musical de Occidente reconoce tres escalas 
en modo menor y cada una de ellas tiene un sabor algo distinto. El blues 
suele utilizar una escala de cinco notas (pentatónica) que es un subgrupo de 
la escala en modo menor, y la música china utiliza una escala pentatónica 
diferente. Cuando Tchaikovsky quiere que pensemos en la cultura árabe o 
china en el ballet Cascanueces, elige escalas que son típicas de sus músicas, 
y en sólo unas notas nos transporta a Oriente. Cuando Billie Holiday quiere 
dar un tono de blues a una melodía estándar, invoca la escala del blues y 
canta notas de una escala que no estamos acostumbrados a oír en la música 
clásica estándar. 

Los compositores conocen estas asociaciones y las utilizan de forma 
intencionada. Nuestros cerebros también las conocen, a través de una vida 
de exposición a idiomas, pautas, escalas, letras musicales y asociaciones 
entre ellos. Cada vez que oímos una pauta musical que es nueva para 
nuestros oídos, el cerebro intenta realizar una asociación a través de las 
claves visuales, auditivas o sensoriales de otro género que puedan 
acompañarla; procuramos contextualizar los nuevos sonidos y acabamos 


creando esos vínculos memorísticos entre un conjunto determinado de notas 
y un lugar determinado o una época o un conjunto de acontecimientos. 
Nadie que haya visto Psicosis de Hitchcok puede oír los chirriantes violines 
de Bernard Hermann sin pensar en la escena de la ducha; cualquiera que 
haya visto alguna vez una película de dibujos animados de «Merrie 
Melody» de Warner Brothers pensará en un personaje subiendo escaleras 
serpenteantes siempre que oiga punteo de violines en una escala mayor 
ascendente. Las asociaciones son lo bastante poderosas (y las escalas lo 
bastante diferenciables) para que sólo hagan falta unas cuantas notas: las 
tres primeras de «China Girl» de David Bowie o «La gran puerta de Kiev» 
(de Cuadros de una exposición) de Mussorgsky transmiten de manera 
instantánea un contexto musical rico y (para nosotros) extranjero. 

Casi toda esta variación de contexto y de sonido procede de formas 
diferentes de dividir la octava y, en casi todos los casos que conocemos, de 
dividirla en no más de doce notas. Se ha afirmado que la música india y la 
árabe-persa utilizan «microtonalidad» (escalas con intervalos mucho más 
pequeños que un semitono), pero un análisis detenido revela que sus escalas 
se basan también en doce notas o menos y las otras son simplemente 
variaciones expresivas, glissandos (deslizamientos continuos de una nota a 
otra), y notas rápidas de pasada, similares a la tradición del blues americano 
de deslizarse en una nota con propósitos emotivos. 

En toda escala existe una jerarquía de importancia entre las notas; 
algunas son más estables, con un sonido estructuralmente más significativo, 
o más decisivo que otras, y nos hacen sentir intensidades distintas de 
tensión y resolución. En la escala mayor, la nota más estable es el primer 
grado, llamado también la tónica. En otras palabras, todas las otras notas de 
la escala parecen apuntar hacia la tónica, pero apuntan con un impulso 
variable. La nota que lo hace con más fuerza es el grado séptimo de la 
escala, si en una escala en do mayor. La nota que apunta con menos fuerza 
hacia la tónica es el grado quinto de la escala, sol en do mayor, y apunta con 
menos fuerza porque se percibe como relativamente estable; esto es sólo 
otra forma de decir que nos sentimos incómodos (indecisos) si una canción 
acaba en el grado quinto de la escala. La teoría de la música especifica esta 
jerarquía tonal. Carol Krumhansl y sus colegas mostraron en una serie de 


estudios que los oyentes ordinarios han incorporado los principios de esta 
jerarquía en el cerebro, a través de la exposición pasiva a las normas 
culturales y musicales. Pidiendo a la gente que valorara lo bien que parecían 
ajustarse las diferentes notas con una escala que ella tocaba, extrajo de sus 
juicios subjetivos la jerarquía teórica. 

Un acorde es simplemente un grupo de tres o más notas tocadas al 
mismo tiempo. Se extraen en general de una de las tres escalas que se 
utilizan habitualmente, y las tres notas se eligen de modo que transmitan 
información sobre la escala de la que se toman. Un acorde característico se 
construye tocando las notas primera, tercera y quinta de una escala 
simultáneamente. Como la secuencia de tonos y semitonos es diferente para 
las escalas menores y mayores, los tamaños de los intervalos son diferentes 
para acordes tomados de este modo de las dos diferentes escalas. Si 
construimos un acorde empezando en do y utilizamos los tonos de la escala 
do mayor, utilizamos do, mi y sol. Si utilizamos la escala do menor, las 
notas primera, tercera y quinta son do, mi bemol y sol. Esa diferencia en el 
tercer grado, entre mi y mi bemol, hace que el propio acorde pase de mayor 
a menor. Todos nosotros, incluso careciendo de formación musical, 
podemos apreciar la diferencia entre esos dos acordes aunque no 
dispongamos de la terminología necesaria para designarlos; el acorde mayor 
nos parece feliz y el menor, triste, o reflexivo, o incluso exótico. Las 
canciones más básicas de música country y del rock utilizan sólo acordes 
mayores: «Johnny B. Good», «Blowin” in the Wind», «Honky Tonk 
Women» y «Mammas Don't Let Your Babies Grow Up to Be Cowboys», 
por ejemplo. 

Los acordes menores añaden complejidad; en «Light My Fire» de los 
Doors, las estrofas se interpretan en acordes menores («You know that it 
would be untrue...») y luego el coro en acordes mayores («Come on baby, 
light my fire»). En «Jolene» Dolly Parton mezcla acordes menores y 
mayores para conseguir un sonido melancólico. «Sheep» (del álbum 
Animals) de Pink Floyd utiliza sólo acordes menores. 

Los acordes, como las notas individuales de la escala, se distribuyen 
también en una jerarquía de estabilidad que depende del contexto. Ciertas 
progresiones de acordes son parte de cada tradición cultural, y la mayoría 


de los niños, incluso a los cinco años de edad, han interiorizado reglas sobre 
las sucesiones de acordes que son legales en la música de su cultura, O 
características de ella; pueden detectar rápidamente desviaciones de las 
secuencias estándar con la misma facilidad con que nosotros podemos 
detectar cuándo una frase está mal formada, como por ejemplo: «La pizza 
estaba demasiado caliente para dormir». Para que el cerebro consiga eso, 
tiene que haber redes de neuronas que formen representaciones abstractas 
de la estructura musical y de las reglas musicales, algo que hacen 
automáticamente y sin nuestro conocimiento consciente. Cuando el cerebro 
es joven es más receptivo (casi como una esponja) y absorbe con avidez 
todos y cada uno de los sonidos que puede y los incorpora a la estructura de 
su Cableado neuronal. Al hacernos mayores, esos circuitos neuronales son 
algo menos maleables, y resulta ya más difícil incorporar, a un nivel 
neuronal profundo, nuevos sistemas musicales, o incluso nuevos sistemas 
lingúísticos. 


El asunto del tono se hace ahora algo más complicado, y la culpa de todo la 
tiene la física. Pero esta complicación da origen al rico espectro de sonidos 
que producen los diferentes instrumentos. Todos los objetos naturales del 
mundo tienen varias formas de vibración. La cuerda de un piano vibra en 
realidad a varias velocidades diferentes al mismo tiempo. Lo mismo sucede 
con la campana que golpeamos con un martillo, los tambores que 
golpeamos con las manos o las flautas en las que soplamos aire: las 
moléculas de aire vibran a varias velocidades simultáneamente, no a una 
velocidad única. 

Una analogía son los diversos tipos de movimientos de la Tierra que se 
producen a la vez. Sabemos que la Tierra gira sobre su eje una vez cada 
veinticuatro horas, que viaja alrededor del Sol una vez cada 365,25 días y 
que todo el sistema solar está girando con la galaxia de la Vía Láctea. Son 
varios tipos de movimientos y se producen todos al mismo tiempo. Otra 
analogía son los muchos modos de vibración que percibimos a menudo 
cuando vamos en tren. Imagina que estás sentado en un tren en una estación 
en el campo, con la locomotora parada. Sopla viento y sientes que el vagón 
se balancea hacia delante y hacia atrás un poquito sólo. Lo hace con una 


regularidad que puedes determinar con un cronómetro manual, y calculas 
que el tren se mueve hacia delante y hacia atrás unas dos veces por 
segundo. Luego, el maquinista pone en marcha la locomotora y sientes un 
tipo diferente de vibración a través del asiento (se debe a las oscilaciones 
del motor: los pistones y el cigiieñal que giran a una velocidad 
determinada). Cuando el tren empieza a moverse, experimentas una tercera 
sensación, el golpeteo de las ruedas cada vez que pasan por un empalme de 
la vía. Experimentas en total varios tipos diferentes de vibraciones, todos 
ellos probablemente a velocidades o frecuencias distintas. Cuando el tren se 
pone en marcha, percibes con claridad una vibración. Pero es muy difícil, y 
hasta imposible, que aprecies cuántas vibraciones se producen y la 
velocidad de cada una. Utilizando instrumentos de medición especializados, 
sin embargo, se podrían apreciar. 

Cuando producimos un sonido en un piano, una flauta o cualquier otro 
instrumento (incluidos los de percusión, como tambores y cencerros) 
generamos muchos modos de vibración que ocurren simultáneamente. 
Cuando escuchas una sola nota ejecutada en un instrumento, estás oyendo 
en realidad muchísimos tonos al mismo tiempo, no un tono único. La 
mayoría no nos damos cuenta de esto de forma consciente, aunque algunas 
personas pueden aprender a oírlos. El que tiene la velocidad de vibración 
más lenta (el tono más bajo) se denomina frecuencia fundamental, y los 
otros se denominan colectivamente armónicos. 

Recapitulando, es una propiedad de los objetos del mundo el que vibren 
generalmente a varias frecuencias distintas a la vez. Lo asombroso es que 
esas otras frecuencias suelen estar relacionadas entre sí matemáticamente de 
una forma muy simple: como múltiplos enteros. Así que si pulsas una 
cuerda y su frecuencia de vibración más lenta es de un centenar de veces 
por segundo, las otras frecuencias vibratorias serán 2 x 100 (200 hercios), 3 
x 100 (300 hercios), etc. Si soplas en una flauta o en una grabadora y 
generas vibraciones a 310 hercios, se producirán vibraciones adicionales del 
doble, el triple, el cuádruple, etc., de esa frecuencia: 620 hercios, 930 
hercios, 1.240 hercios, y así sucesivamente. Cuando un instrumento crea 
energía a frecuencias que son múltiples enteros como en este caso, decimos 
que el sonido es armónico, y denominamos la pauta de energía a diferentes 


frecuencias la serie armónica. Hay pruebas de que el cerebro reacciona a 
esos sonidos armónicos con activaciones neuronales sincrónicas, y las 
neuronas del córtex auditivo reaccionan a cada uno de los componentes del 
sonido sincronizando entre sí su velocidad de activación y creando una base 
neuronal para la cohesión de esos sonidos. 

El cerebro está tan sintonizado con la serie armónica que si nos 
encontramos con un sonido que tiene todos los componentes excepto el 
fundamental, el cerebro lo llena por nosotros en un fenómeno denominado 
«restauración de la fundamental ausente». Un sonido compuesto de energía 
a 100 hercios, 200 hercios, 300 hercios, 400 hercios y 500 hercios se 
percibe como si tuviese una altura de tono de 100 hercios, su frecuencia 
fundamental. Pero si creamos artificialmente un sonido con energía a 200 
hercios, 300, 400 y 500 (dejando fuera el fundamental) lo percibiremos de 
todos modos como si tuviese una altura de tono de 100 hercios. No lo 
percibimos como si tuviese un tono de 200 hercios porque nuestro cerebro 
«sabe» que un sonido armónico normal con un tono de 200 hercios tendría 
una serie armónica de 200 hercios, 400, 600, 800, etc. Podemos engañar 
también al cerebro ejecutando secuencias que se desvíen de la serie 
armónica como esta: 100 hercios, 210, 302, 405, etc. En esos casos, el tono 
que se percibe se aparta de los 100 hercios en una solución de compromiso 
entre lo que se presenta y lo que sería una serie armónica normal. 

Cuando era un estudiante de licenciatura, mi tutor, Mike Posner, me 
habló del trabajo de un estudiante de posgrado de biología, Petr Janata. 
Aunque no se había criado en San Francisco, Petr tenía el pelo largo y 
abundante como yo y lo llevaba recogido en una cola de caballo, tocaba al 
piano jazz y rock y vestía con prendas de esas que se tiñen atadas: una 
verdadera alma gemela. Petr colocó electrodos en el culículo inferior de 
unas lechuzas, que es parte de su sistema auditivo. Luego les puso una 
versión de «El vals del Danubio azul» de Strauss, compuesto de notas de las 
que se había eliminado la frecuencia fundamental. Su hipótesis era que si la 
fundamental ausente se restauraba a niveles iniciales del proceso auditivo, 
las neuronas del culículo inferior de la lechuza se activarían a la velocidad 
de esa fundamental ausente. Eso fue exactamente lo que descubrió. Y 
debido a que los electrodos emiten una pequeña señal eléctrica con cada 


activación (y como la «velocidad» de activación es la misma que una 
«frecuencia» de activación), Petr envió las señales de esos electrodos a un 
pequeño amplificador y repitió el sonido de las neuronas de la lechuza a 
través de un altavoz. Lo que oyó era asombroso; la melodía de «El vals del 
Danubio azul» cantada claramente a través de los altavoces: ba da da da da, 
dit dit, dit dit. Estábamos oyendo las velocidades de activación de las 
neuronas y eran idénticas a la frecuencia de la fundamental ausente. Las 
series armónicas tenían una ejemplificación no sólo en los niveles 
tempranos del procesamiento auditivo, sino en una especie completamente 
distinta. 

Podemos imaginar una especie alienígena que no tenga oídos, o que no 
tenga la misma experiencia interior de oír que nosotros. Pero sería difícil 
imaginar una especie avanzada que no tuviese absolutamente ninguna 
posibilidad de percibir las vibraciones de los objetos. Donde hay atmósfera 
hay moléculas que vibran en respuesta al movimiento. Y saber si algo está 
generando ruido o avanzando hacia nosotros o alejándose de nosotros, aun 
en el caso de que no podamos verlo (porque está oscuro, porque nuestros 
ojos no están atendiendo a ello, porque estamos dormidos) tiene un gran 
valor de supervivencia. 

Como la mayoría de los objetos físicos hacen vibrar a las moléculas de 
varios modos al mismo tiempo, y como en muchos, muchísimos objetos 
esos modos mantienen entre sí relaciones de enteros simples, la serie 
armónica es un hecho real de este mundo que esperamos hallar en todas 
partes a las que miremos: en Norteamérica, en las islas Fiji, en Marte y en 
los planetas que orbitan Antares. Es probable que todo organismo que 
evolucione en un mundo con objetos que vibran (dado un período de tiempo 
evolutivo suficiente) haya desarrollado una unidad de procesamiento en el 
cerebro que incorpore esas regularidades de su mundo. Dado que el tono es 
una clave fundamental de la identidad de un objeto, deberíamos esperar 
encontrarnos con mapas tonotópicos como los que existen en el córtex 
auditivo humano, y activaciones neuronales sincrónicas para tonos que 
tienen entre ellos relaciones armónicas de octava y de otro tipo; esto 
ayudaría al cerebro (alienígena o terrestre) a deducir que todos estos 
sonidos probablemente proceden del mismo objeto. 


Para referirse a los armónicos suelen utilizarse números: el primer 
armónico es la primera frecuencia de vibración por encima de la 
fundamental, el segundo armónico es la segunda frecuencia de vibración 
por encima de la fundamental, etc. No todos los instrumentos vibran de 
modos tan nítidamente definidos. A veces, como sucede con el piano 
(porque es un instrumento percusivo), los armónicos pueden estar próximos 
a ser múltiplos exactos de la frecuencia fundamental pero no llegar a serlo, 
y esto contribuye a su sonido característico. Los instrumentos de percusión, 
los carillones y otros objetos suelen tener (dependiendo de la composición y 
la forma) armónicos que no son claramente múltiples enteros del 
fundamental, y se les denomina armónicos parciales o inarmónicos. Los 
instrumentos con armónicos inarmónicos carecen en general del sentido 
claro del tono que asociamos con los instrumentos armónicos, y la base del 
córtex puede por ello no experimentar una activación neural sincrónica. 
Pero de todos modos tienen un sentido del tono, y esto podemos apreciarlo 
con total claridad cuando tocamos notas inarmónicas en sucesión. Aunque 
tal vez no podamos tararear con el sonido de una sola nota ejecutada en un 
bloque de madera chino o en un carillón, sí podemos interpretar una 
melodía identificable en una serie de bloques de madera chinos o carillones, 
porque nuestro cerebro se centra en los cambios de los armónicos de uno a 
otro. Esto es básicamente lo que pasa cuando oímos a la gente interpretar 
una canción con los carrillos. 

Una flauta, un violín, una trompeta y un piano pueden tocar el mismo 
tono, es decir, se puede escribir una nota en una partitura musical y cada 
instrumento tocará un tono con una frecuencia fundamental idéntica y 
nosotros oiremos (tenderemos a hacerlo) un tono idéntico. Pero todos estos 
instrumentos suenan de una forma muy distinta unos de otros. 

Esta diferencia es el timbre, y es la característica más importante y 
ecológicamente más relevante de los fenómenos auditivos. El timbre de un 
sonido es la característica principal que diferencia el rugido de un león del 
ronroneo de un gato, el restallar del trueno del estrépito de las olas del mar, 
la voz de un amigo de la del cobrador de facturas al que uno está intentando 
eludir. La discriminación tímbrica es tan aguda en los humanos que la 
mayoría de nosotros podemos reconocer centenares de voces distintas. 


Podemos saber incluso si alguien próximo a nosotros (nuestra madre, 
nuestra esposa) es feliz o está triste, está sano o tiene un catarro, 
basándonos en el timbre de su voz. 

El timbre es una consecuencia de los armónicos. Los diferentes 
materiales tienen diferentes densidades. Un trozo de metal tenderá a 
hundirse hasta al fondo de un estanque; un trozo de madera del mismo 
tamaño y de la misma forma flotará. Debido en parte a la densidad y en 
parte al tamaño y la forma, los diferentes objetos hacen también ruidos 
distintos cuando les das un golpe con la mano o un golpecito suave con un 
martillo. Imagina el sonido que oirías si le dieses un golpe con un martillo 
(¡suavemente, por favor!) a una guitarra: sería un plunk hueco a madera. O 
si el golpe se lo dieses a una pieza de metal, como un saxofón: sería un 
pequeño plink. Cuando golpeas esos objetos, la energía del martillo hace 
vibrar las moléculas dentro de ellos, que bailan a varias frecuencias 
distintas, determinadas por el material del que está hecho el objeto, por su 
tamaño y por su forma. Si el objeto vibra a, por ejemplo, 100 hercios, 200, 
300, 400, etc., la intensidad de la vibración no tiene que ser la misma para 
cada uno de estos armónicos, y de hecho lo característico es que no lo sea. 

Cuando oyes un saxofón tocando una nota con una frecuencia 
fundamental de 220 hercios, estás oyendo en realidad muchas notas, no sólo 
una. Las otras notas que oyes son de múltiples enteros de la fundamental: 
440, 660, 880, 1200, 1420, 1540, etc. Estas notas diferentes (los armónicos) 
tienen diferentes intensidades, y por eso nos parece al oírlas que tienen un 
volumen sonoro distinto. La pauta concreta de volumen sonoro para esas 
notas es distintiva del saxofón, y son ellas las que dan origen a su color 
tonal único, a su sonido único: su timbre. Un violín que toque la misma 
nota escrita (220 hercios) producirá armónicos de las mismas frecuencias, 
pero el volumen sonoro de cada uno de ellos respecto a los otros será 
diferente. De hecho, existe una pauta única de armónicos para cada 
instrumento. El segundo armónico podría ser en uno más fuerte que en otro, 
mientras que el quinto podría ser más suave. Prácticamente toda la 
variación tonal que oímos (la cualidad que otorga a una trompeta su 
«trompetidad» y que proporciona un piano su «pianez») procede de la 


forma peculiar en que están distribuidos los volúmenes sonoros de los 
armónicos. 

Cada instrumento tiene su propio perfil armónico, que es como una 
huella dactilar. Se trata de una pauta compleja que podemos utilizar para 
identificar el instrumento. Los clarinetes, por ejemplo, se caracterizan por 
tener un grado relativamente alto de energía en los armónicos impares: tres 
veces, cinco veces y siete veces los múltiplos de la frecuencia fundamental, 
etc. (Esto se debe a que es un tubo cerrado por un extremo y abierto por el 
otro.) Las trompetas se caracterizan por tener un grado relativamente 
equilibrado de energía tanto en los armónicos pares como los impares (la 
trompeta, como el clarinete, está también cerrada en un extremo y abierta 
en el otro, pero la boquilla y el pabellón están diseñados para suavizar las 
series armónicas). Un violín al que se aplique el arco en el centro producirá 
primordialmente armónicos impares, y en consecuencia puede sonar de una 
forma parecida a un clarinete. Pero si se aplica el arco a un tercio de la parte 
baja, el instrumento resalta el tercer armónico y sus múltiples: el sexto, el 
noveno, el duodécimo, etc. 

Todas las trompetas tienen una huella dactilar tímbrica, y se distingue 
fácilmente de la de un violín, la de un piano e incluso la de la voz humana. 
Para el oído experimentado, y para la mayoría de los músicos, existen 
diferencias incluso entre trompetas: no todas ellas suenan igual, ni todos los 
pianos ni todos los acordeones. (A mí los acordeones me suenan todos 
igual, y el sonido más dulce y placentero que puedo imaginar es el que 
harían todos ellos ardiendo en una hoguera gigantesca.) Lo que diferencia 
un piano concreto de otro es que sus perfiles armónicos diferirán 
ligeramente entre sí, aunque no, por supuesto, tanto como diferirán ambos 
del perfil de un clavicémbalo, un órgano o una tuba. Los buenos músicos 
pueden apreciar las diferencias entre un violín Stradivarius y un Guarneri 
después de oír una o dos notas. Yo puedo apreciar con claridad la diferencia 
entre mi guitarra acústica Martin 000-18 de 1956, mi Martin D-18 de 1973 
y mi Collings D2H de 1996; suenan como instrumentos distintos, aunque 
son todas guitarras acústicas; nunca confundiría una con otra. Eso es el 
timbre. 


Los instrumentos naturales (es decir, instrumentos acústicos hechos de 
materiales del mundo real como metal y madera) tienden a producir energía 
a varias frecuencias al mismo tiempo por el modo de vibrar de la estructura 
interna de sus moléculas. Supongamos que inventase un instrumento que, a 
diferencia de los instrumentos naturales que conocemos, produjese energía 
a una frecuencia y sólo a una. Llamemos a este instrumento hipotético 
generador (porque genera notas de frecuencias específicas). Si alinease un 
grupo de generadores, podría poner a cada uno de ellos a tocar una 
frecuencia específica correspondiente a la serie armónica de un instrumento 
determinado tocando una nota determinada. Podría tener un grupo de esos 
generadores emitiendo sonidos a 110, 220, 330, 440, 550 y 660 hercios, que 
darían la impresión al oyente de una nota de 110 hercios tocada por un 
instrumento musical. Además, podría controlar la amplitud de cada uno de 
mis generadores y hacer que cada una de las notas se tocase con una 
intensidad determinada, que correspondiese al perfil armónico de un 
instrumento musical natural. Si hiciese eso, el grupo de generadores 
resultante se aproximaría al sonido de un clarinete, una flauta o cualquier 
otro instrumento que yo estuviese intentando emular. 

Con una síntesis aditiva así conseguiría una versión sintética de un 
timbre de instrumento musical agrupando componentes sónicos elementales 
del sonido. Muchos órganos de tubos, como los que hay en las iglesias, 
tienen una característica que permite comprobar esto. En la mayoría de los 
órganos de tubos se aprieta una tecla (o un pedal), que envía un chorro de 
aire a través de un tubo de metal. El órgano consta de centenares de tubos 
de tamaños distintos, y Cada uno produce un tono diferente, en 
correspondencia a su tamaño, cuando se lanza aire a través de él; pueden 
concebirse como flautas mecánicas, en las que un motor eléctrico 
suministra el aire. El sonido que asociamos con un órgano de iglesia (su 
timbre particular) se debe a que se produce energía a varias frecuencias 
distintas al mismo tiempo, como en otros instrumentos. Cada tubo del 
órgano produce una serie armónica, y cuando se pulsa una tecla en el 
teclado del órgano, se dispara una columna de aire a través de más de un 
tubo al mismo tiempo, generando un espectro muy rico de sonidos. Esos 
tubos suplementarios, además del que vibra a la frecuencia fundamental de 


la nota que se está intentando tocar, producen notas que son múltiplos 
enteros de la frecuencia fundamental, o que tienen una estrecha relación 
matemática y armónica con ella. 

El organista decide, como es lógico, por cuál de esos tubos 
suplementarios quiere que pase el aire accionando y activando palancas o 
tiradores que dirigen el flujo de aire. Un buen organista, sabiendo que los 
clarinetes tienen mucha energía en los armónicos impares de la serie 
armónica, podría simular el sonido de un clarinete manipulando tiradores de 
manera que recreasen la serie armónica de ese instrumento. Un poquito de 
220 hercios aquí, una pincelada de 330 hercios, una gota de 440, una buena 
ración de 550 y voila!..., ha cocinado un facsímil razonable de un 
instrumento. 

A partir de fimales de la década de los cincuenta los científicos 
empezaron a experimentar integrando esas capacidades de síntesis en 
instrumentos electrónicos más pequeños y compactos, y crearon una familia 
de nuevos instrumentos musicales conocidos comunmente como 
sintetizadores. En la década de los sesenta se oyeron sintetizadores en 
discos de los Beatles (en «Here Comes the Sun» y «Maxwell's Silver 
Hammer») y de Walter/Wendy Carlos (Switched-On Bach), y luego en 
grupos que esculpían su sonido en torno al sintetizador, como Pink Floyd y 
Emerson, Lake and Palmer. 

Muchos de esos sintetizadores utilizaban síntesis aditivas como la 
descrita aquí, y más tarde pasaron a utilizar algunos algoritmos más 
complejos, como la síntesis de guía de ondas (inventada por Julius Smith en 
Stanford) y la síntesis de frecuencia modulada (inventada por John 
Chowning, también en Stanford). Pero limitarse a copiar el perfil armónico, 
cuando se puede crear un sonido que recuerde al del instrumento real, 
proporciona una copia bastante pobre. En el timbre hay algo más que la 
serie armónica. Los investigadores aún discuten sobre lo que es ese «algo 
más», pero se acepta en general que, además del perfil armónico, definen el 
timbre otros dos atributos que dan origen a una diferencia perceptiva entre 
un instrumento y otro: ataque y flujo. 

La Universidad de Stanford se halla en una extensión bucólica de tierra 
situada justo al sur de San Francisco y al este del océano Pacífico. Hacia el 


oeste se extienden colinas onduladas cubiertas de hierba y a sólo una hora 
en dirección este se encuentra el fértil Central Valley de California, donde 
se producen buena parte de las uvas pasas, el algodón, las naranjas y las 
almendras del mundo. Hacia el sur, cerca de la población de Gilroy, hay 
grandes campos de ajo. También hacia el sur está Castroville, conocida 
como la «capital del mundo de la alcachofa». (Yo propuse una vez a la 
Cámara de Comercio de Castroville que cambiasen lo de «capital» por 
«corazón». La propuesta no provocó demasiado entusiasmo.) 

Stanford se ha convertido en una especie de segundo hogar para los 
ingenieros y científicos informáticos que aman la música. John Chowning, 
que era famoso como compositor de vanguardia, ocupa allí una cátedra en 
el departamento de música desde los años setenta, y figuró en un grupo de 
compositores pioneros de la época que utilizaban el ordenador para crear, 
almacenar y reproducir sonidos en sus composiciones. Más tarde se 
convirtió en director y fundador del Centro de Investigación Informática de 
Música y Acústica, conocido por sus siglas en inglés como CCRMA (se 
pronuncia CAR-ma; los que pertenecen a él dicen bromeando que la 
primera c es muda). Chowning es un hombre amistoso y cordial. Cuando yo 
era estudiante en Stanford, me ponía una mano en el hombro y me 
preguntaba en qué estaba trabajando. Tenía esa sensación de que hablar con 
un estudiante era para él una oportunidad de aprender algo. Al principio de 
los años setenta, mientras trabajaba con el ordenador y con ondas 
sinusoidales (el tipo de sonidos artificiales que se producen con 
ordenadores y que se utilizan para construir bloques de síntesis aditiva) se 
dio cuenta de que al cambiar la frecuencia de esas ondas al tocarlas creaba 
sonidos musicales. Controlando esos parámetros, podía simular los sonidos 
de una serie de instrumentos musicales. Esta nueva técnica pasaría a 
conocerse como síntesis de frecuencia modulada, o síntesis FM, y se 
incorporó por primera vez en la serie Yamaha DX9 y DX7 de 
sintetizadores, que revolucionó la industria de la música desde el momento 
en que se introdujeron en 1983. La síntesis de FM democratizó la síntesis 
musical. Antes de ella, los sintetizadores eran caros, toscos y difíciles de 
controlar. Crear nuevos sonidos lleva mucho tiempo, hay que experimentar 
mucho y hay que tener conocimientos prácticos. Pero con la FM, cualquier 


músico podía obtener un sonido instrumental convincente sólo con tocar un 
botón. Los escritores de canciones y los compositores que no podían 
permitirse contratar a una sección de viento de una orquesta podían ya 
trabajar con esas texturas y esos sonidos. Compositores y orquestadores 
podían ensayar arreglos antes de ocupar el tiempo de una orquesta entera 
para ver lo que funcionaba y lo que no. Las bandas New Wave, como los 
Cars y los Pretenders, así como artistas como Stevie Wonder, Hall and 
Oates y Phil Collins, empezaron a utilizar ampliamente la síntesis FM en 
sus grabaciones. Mucho de lo que consideramos «el sonido de los ochenta» 
en la música popular debe su carácter distintivo al sonido concreto de la 
síntesis de FM. 

Con la popularización de la FM llegó una corriente constante de 
ingresos de derechos que permitieron a Chowning crear el CCRMA, 
atrayendo a estudiantes graduados y docentes reconocidos. Entre las 
primeras de las muchas celebridades famosas de la música electrónica y de 
la psicología de la música que acudieron al CCRMA estaban John R. Pierce 
y Max Mathews. Pierce había sido vicepresidente de investigación de los 
laboratorios de Bell Telephone de Nueva Jersey, y había supervisado al 
equipo de ingenieros que construyeron y patentaron el transistor (y fue 
precisamente él quien puso nombre al nuevo artilugio: TRANSfer 
resISTOR). En su distinguida carrera, se le atribuyó también la invención 
del tubo de vacío de onda viajera y el lanzamiento del primer satélite de 
comunicaciones, Telstar. Era también un respetado escritor de ciencia 
ficción con el seudónimo de J. J. Coupling. Pierce creaba un entorno 
extraño en cualquier industria o laboratorio de investigación, en el que los 
científicos se sentían con permiso para hacer lo mejor que supiesen y en el 
que la creatividad se valoraba mucho. En esa época, la Bell Telephone 
Company/AT8xT tenía el monopolio del servicio telefónico en los Estados 
Unidos y grandes fondos. Su laboratorio era una especie de terreno de juego 
para los mejores y más brillantes científicos, ingenieros e inventores del 
país. En la «caja de arena» de ese laboratorio, Pierce permitía a su gente ser 
creadora sin preocuparse por el balance final ni por la aplicación de sus 
ideas al comercio. Comprendía que sólo puede haber verdadera innovación 
cuando la gente no tiene que censurarse a sí misma y puede dejar que 


fluyan libres las ideas. Aunque sólo una pequeña proporción de esas ideas 
puedan ser prácticas y una proporción aún menor se conviertan en 
productos, esos productos serían innovadores, únicos y potencialmente muy 
rentables. En ese entorno surgió toda una serie de innovaciones, entre ellas 
lásers, ordenadores digitales y el sistema operativo Unix. 

Yo conocí a Pierce en 1990, cuando tenía ya ochenta años y daba 
conferencias sobre psicoacústica en el CCRMA. Varios años más tarde, 
después de doctorarme y volver a Stanford, nos hicimos amigos y salíamos 
todos los miércoles a cenar y a hablar de la investigación. En una ocasión 
me pidió que le explicara el rock and roll, algo a lo que él nunca había 
prestado la menor atención y que no comprendía. Sabía de mi experiencia 
anterior en el negocio de la música, y me preguntó si podría acercarme a 
cenar a su casa una noche y tocar seis canciones que transmitiesen todo lo 
que era importante saber sobre el rock and roll. ¿Seis canciones para 
transmitir todo el rock? Yo no estaba seguro de poder reunir seis canciones 
que transmitiesen lo que eran los Beatles, no digamos ya todo el rock. La 
noche antes me llamó para explicarme que había oído a Elvis Presley, así 
que no necesitaba ya cubrir eso. 

He aquí lo que llevé a aquella cena: 


1) «Long Tall Sally», Little Richard 

2) «Roll Over Beethoven», los Beatles 

3) «All Along the Watchtower», Jimi Hendrix 
4) «Wonderful Tonight», Eric Clapton 

5) «Little Red Corvette», Prince 

6) «Anarchy in the UK», los Sex Pistols 


En un par de las piezas elegidas combinaban grandes autores de canciones 
con intérpretes distintos. Todas son grandes canciones, pero incluso ahora 
me gustaría hacer algunos ajustes. Pierce escuchaba y preguntaba 
continuamente quién era aquella gente, qué instrumentos estaba oyendo y 
cómo podían sonar como sonaban. Dijo que lo que más le gustaba eran los 
timbres de la música. Las canciones en sí y los ritmos no le interesaban 
tanto, pero los timbres le parecieron sorprendentes: nuevos, extraños y 


excitantes. El fluido romanticismo del solo de guitarra de Clapton en 
«Wonderful Tonight», junto con una batería blanda y amortiguada. La 
fuerza pura y la densidad de la pared de ladrillo de guitarras y bajo y batería 
de los Sex Pistols. El sonido distorsionado de una guitarra eléctrica no era 
nada nuevo para Pierce. Lo que era nuevo para él era aquel modo en que los 
instrumentos se combinaban para crear un todo unificado (bajo, batería, 
guitarras eléctrica y acústica, voz). Para Pierce lo que definía el rock era el 
timbre. Y eso fue una revelación para ambos. 

Las alturas de tono que utilizamos en música (las escalas) se han 
mantenido básicamente invariables desde la época de los griegos, con la 
excepción del desarrollo (en realidad un perfeccionamiento) de la escala 
temperada unificada en la época de Bach. El rock puede ser la etapa final en 
una revolución musical de un milenio de duración que dio a las quintas y 
cuartas perfectas una prominencia que históricamente sólo se había 
otorgado a la octava. En ese período, la música occidental estuvo dominada 
principalmente por el tono. Durante los últimos doscientos años, ha ido 
cobrando cada vez más importancia el timbre. Una práctica habitual de la 
música común a todos los géneros es repetir una melodía utilizando 
diferentes instrumentos: desde la Quinta de Beethoven y el Bolero de Ravel 
a «Michelle» de los Beatles y «All My Ex's Live in Texas» de George 
Strait. Se han inventado nuevos instrumentos musicales para que los 
compositores pudiesen tener una paleta mayor de colores tímbricos con los 
que trabajar. Cuando un cantante de música country o de música popular 
deja de cantar y toma la melodía otro instrumento (incluso sin introducir 
ningún cambio en ella) nos resulta agradable la repetición de la misma 
melodía con un timbre distinto. 


El compositor de vanguardia Pierre Schaeffer realizó en la década de los 
cincuenta sus famosos experimentos de la «campana cortada» que fueron 
cruciales y que demostraron un importante atributo del timbre. Grabó una 
serie de instrumentos orquestales en cinta. Luego, utilizando una hoja de 
afeitar, cortó el principio de esos sonidos. Esta primera parte inicial del 
sonido de un instrumento musical se llama ataque; es el sonido del golpe 


inicial, el rasgueo, el soplo de aire primero que provoca que el instrumento 
suene. 

El gesto que hace nuestro cuerpo para crear sonido con un instrumento 
tiene una influencia importante en el sonido que éste produce. Pero ese 
efecto desaparece casi por completo tras los primeros segundos. Casi todos 
los gestos que hacemos para producir un sonido son impulsivos, entrañan 
explosiones breves y puntuales de actividad. En los instrumentos de 
percusión, lo característico es que el músico no se mantiene en contacto con 
el instrumento después de este impulso inicial. En los instrumentos de 
viento y los de arco, sin embargo, continúa en contacto con el instrumento 
después del acto impulsivo inicial: el momento en que el soplo de aire sale 
de la boca o el arco entra en contacto con la cuerda; el soplo y el 
movimiento del arco que siguen tienen un carácter más continuo y suave y 
menos impulsivo. 

La introducción de energía en un instrumento (la fase de ataque) crea 
normalmente energía a muchas frecuencias distintas que no están 
relacionadas entre sí por simples múltiples enteros. En otras palabras, 
durante el breve período que sigue a nuestra acción de golpear, soplar, 
rasguear o hacer otra cosa que provoque que un instrumento empiece a 
sonar, el impacto mismo tiene una cualidad bastante ruidosa que no es 
especialmente musical, sino que se parece más al sonido de un martillo 
golpeando un trozo de madera, por ejemplo, que al de un martillo 
golpeando una campana o la cuerda un piano, o como el sonido del viento 
corriendo a lo largo de un tubo. Después del ataque hay una fase más 
estable en la que la nota musical adquiere una pauta ordenada de 
frecuencias armónicas al empezar a resonar el metal o la madera (u otro 
material) del que el instrumento esté compuesto. Esta parte media de una 
nota musical se denomina el estado estable... En la mayoría de los casos el 
perfil armónico es relativamente estable mientras el sonido emana del 
instrumento durante este período. 

Después de eliminar el ataque de las grabaciones de instrumentos 
orquestales, Schaeffer volvió a poner la cinta y descubrió que a la mayoría 
de la gente le resultaba casi imposible identificar el instrumento que sonaba. 
Sin el ataque, piano y campanas sonaban de una forma notoriamente 


distinta de los pianos y las campanas, y resultaban muy similares entre sí. Si 
se empalma el ataque de un instrumento en el estado estable, o cuerpo, de 
otro, se obtienen resultados diversos: en unos casos, se oye un instrumento 
híbrido ambiguo que suena más como el instrumento del que procede el 
arranque que del que procede el estado estable. Michelle Castellengo y 
otros han descubierto que se pueden crear de ese modo instrumentos 
completamente nuevos; por ejemplo, introduciendo un sonido de arco del 
violín en una nota de flauta se crea un sonido que se parece muchísimo al 
de un organillo callejero. Estos experimentos demostraron la importancia 
del ataque. 

La tercera dimensión del timbre (flujo) se refiere a cómo el sonido 
cambia una vez iniciado. Los platillos o el gong tienen mucho flujo (su 
sonido cambia de forma espectacular a lo largo del curso temporal de 
duración) mientras que una trompeta tiene menos flujo: su tonalidad es más 
estable a medida que se desarrolla. Además, los instrumentos no suenan 
igual en todo su registro. Es decir, el timbre de un instrumento tiene un 
sonido distinto si se tocan notas altas o bajas. Cuando Sting se eleva hacia 
la cima de su registro vocal en «Roxanne» (The Police), su voz tensa y 
atiplada transmite un tipo de emoción que no puede conseguir en las partes 
más bajas de su registro, como cuando oímos en el verso inicial de «Every 
Breath You Take» un sonido anhelante más deliberado. La parte alta del 
registro de Sting nos suplica con urgencia cuando se tensan sus cuerdas 
vocales, la parte baja sugiere un dolor sordo que tenemos la sensación de 
que lleva padeciendo mucho tiempo, pero que aún no ha llegado al punto de 
ruptura. 

El timbre es algo más que los diferentes sonidos que producen los 
instrumentos. Los compositores se valen de él en la composición; eligen 
instrumentos musicales (y combinaciones de ellos) para expresar 
determinadas emociones y para transmitir una sensación de atmósfera o 
ambiente. Pensemos en el timbre casi cómico del fagot de la Suite del 
cascanueces de Tchaikovsky cuando inicia la «danza china», y la 
sensualidad del saxofón de Stan Getz en «Here*s That Rainy Day». Cambia 
las guitarras eléctricas de «Satisfaction» de los Rolling Stones por un piano 
y tendrás algo completamente distinto. Ravel utilizó el timbre como un 


elemento compositivo en el Bolero, repitiendo el esquema una y otra vez 
con timbres diferentes; lo hizo después de sufrir una lesión cerebral que 
afectó a su capacidad para apreciar el tono. Cuando pensamos en Jimi 
Hendrix, lo que es probable que recordemos con más intensidad es el timbre 
de sus guitarras eléctricas y Su voz. 

Compositores como Scriabin y Ravel hablan de sus obras como pinturas 
sonoras, en las que las notas de las melodías son el equivalente del contorno 
y la forma, y el timbre equivale al uso del color y el sombreado. Varios 
cantantes populares (Stevie Wonder, Paul Simon y Lindsey Buckingham) 
también han descrito sus composiciones como cuadros sonoros, en los que 
el timbre desempeña un papel equivalente al que tiene el color en el arte 
visual, separando entre sí las formas melódicas. Pero una de las cosas que 
hace la música diferente de la pintura es que es dinámica, cambia a lo largo 
del tiempo, y lo que impulsa la música hacia delante son el ritmo y el 
compás. El ritmo y el compás son el motor que conduce casi toda la música, 
y es probable que fuesen los primeros elementos utilizados por nuestros 
ancestros para hacer protomúsica, una tradición todavía presente hoy en el 
uso tribal de los tambores y en los rituales de diversas culturas 
preindustriales. Aunque yo creo que el timbre es ahora el centro de nuestra 
valoración de la música, el ritmo ha mantenido un poder superior sobre los 
oyentes durante mucho más tiempo. 
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ZAPATEADO 


RITMO, INTENSIDAD Y ARMONÍA 


Yo vi actuar a Sonny Rollins en Berkeley en 1977; es uno de los 
saxofonistas más melódicos de nuestro tiempo. Casi treinta años después, 
no puedo recordar ninguno de los tonos de su interpretación, pero recuerdo 
con Claridad algunos de los ritmos. En determinado momento, Rollins 
improvisó durante tres minutos y medio tocando la misma nota una y otra 
vez con ritmos diferentes y sutiles cambios de tiempos. ¡Toda aquella fuerza 
en una nota! Lo que puso de pie al público no fue la innovación melódica, 
fue el ritmo. Casi todas las culturas y civilizaciones consideran el 
movimiento parte integral de la composición de la música y de su audición. 
Bailamos con el ritmo, movemos con él el cuerpo y zapateamos con él. En 
numerosas interpretaciones de jazz, la parte que más excita al público es el 
solo de tambor. No es ninguna coincidencia que hacer música exija el uso 
rítmico y coordinado del cuerpo, y que la energía se transmita de los 
movimientos corporales a un instrumento musical. A un nivel neuronal, 
tocar un instrumento exige la orquestación de regiones de nuestro cerebro 
reptil primitivo (el cerebelo y el tallo cerebral) así como sistemas cognitivos 
superiores del córtex motriz (del lóbulo parietal) y las regiones 
planificadoras de los lóbulos frontales, el sector más avanzado del cerebro. 
Ritmo, compás y tempo son conceptos relacionados que se confunden a 
menudo entre sí. Abreviando, «ritmo» se refiere a las longitudes de las 
notas, «tempo» a la velocidad de una pieza de música (que seguirías 
zapateando) y «compás» a cuando zapateas fuerte frente a cuando lo haces 


débilmente, y a cómo esos zapateos fuertes y débiles se agrupan para 
formar unidades mayores. 

Una de las cosas que normalmente queremos saber cuando 
interpretamos música es lo larga que debe tocarse una nota. La relación 
entre la longitud de una nota y otra es lo que llamamos ritmo, y es una parte 
crucial de lo que convierte el sonido en música. Entre los ritmos más 
famosos de nuestra cultura está el que suele denominarse «afeitado y corte 
de pelo, veinticinco centavos» («shave-and-a-haircut, two bits»), utilizado a 
veces como la llamada «secreta» en una puerta. En una grabación de 1899 
de Charles Hale, «At a Darktown Cakewalk», se hace el primer uso 
documentado de este ritmo. Luego se le agregó letra al ritmo en 1914 en 
una canción de Jimmie Monaco y Joe McCarthy titulada «Bum-Diddle-De- 
Um-Bum, Thats It». En 1939, utilizaron la misma frase musical Dan 
Shapiro, Lester Lee y Milton Berle en «Shave and a Haircut—Shampoo». 
Cómo veinticinco centavos (two bits) se convirtió en champú (shampoo) es 
un misterio. Hasta Leonard Bernstein participó en el asunto, incluyendo 
este ritmo en la canción «Gee, Officer Krupke» del musical West Side Story. 
En «afeitado y corte de pelo, veinticinco centavos» oímos una serie de notas 
de dos longitudes diferentes, larga y corta; las notas largas son el doble de 
largas que las cortas: larga-corta-corta-larga-larga (silencio) larga-larga. 

En la obertura de Guillermo Tell de Rossini (lo que muchos de nosotros 
conocemos como el tema de El llanero solitario) oímos también una serie 
de notas de dos longitudes diferentes, larga y corta; las notas largas son 
también el doble de largas que las cortas: da-da-bump da-da-bump bump 
bump (utilizo aquí la sílaba «da» para corta, y la sílaba «bump» para larga). 
«Mary Had a Little Lamb» utiliza sílabas cortas y largas también, en este 
caso seis notas de igual duración (Ma-ry had a li-tle) seguidas de una larga 
(lamb) de aproximadamente doble longitud que las cortas. La proporción 
rítmica de 2:1, como la octava en las proporciones tónicas, es según parece 
un universal musical. Lo vemos en el tema de The Mickey Mouse Club 
(bump-ba bump-ba bump-ba bump-ba bump-ba bump-ba baaaaá) en que 
tenemos tres niveles de duración, cada uno el doble de largo que el otro. Lo 
vemos en «Every Breath You Take» de The Police (da-da-bump da-da 
baaaaá), en que hay de nuevo tres niveles: 


Ev-ry breath you-o0 taaake 
ELL 2 4 


(El 1 representa una unidad de cierto tiempo arbitrario sólo para ilustrar que 
las palabras breath y you son el doble de largas que las sílabas Ev y ry, y 
que la palabra take es cuatro veces más larga que Ev o ry y el doble de larga 
que breath y you.) 

Los ritmos de la mayoría de la música que escuchamos no son tan 
simples. Del mismo modo que una disposición determinada de alturas de 
tono (la escala) puede evocar música de un idioma, un estilo o una cultura 
diferentes, también puede hacerlo una disposición determinada de ritmos. 
Aunque la mayoría no seríamos capaces de reproducir un complejo ritmo 
latino, identificamos en cuanto lo oímos que es latino, y que no es chino, 
árabe, indio o ruso. Cuando organizamos ritmos en cadenas de notas, de 
longitudes y acentos variables, desarrollamos compás y establecemos 
tempo. 

«Tempo» es la velocidad a la que se desarrolla una pieza musical: lo 
rápida o lenta que va. Si zapateas o chasqueas los dedos acompañando una 
pieza de música, el tempo de la pieza estará directamente relacionado con lo 
deprisa o lo despacio que zapatees. Si una canción fuese una entidad viva 
que respirase podrías imaginar el tempo como su paso (la velocidad a la que 
camina) o su pulso (la velocidad a la que late el corazón de la canción). 
«Tiempo» indica la unidad básica de medición de una pieza musical; 
también se llama tactus. Lo más frecuente es que éste sea el punto natural 
en el que zapatees o chasquees los dedos o batas palmas. A veces, la gente 
zapatea a la mitad o al doble debido a diferentes mecanismos de 
procesamiento neuronal de la persona, así como a diferencias de formación, 
experiencia e interpretación musical de una pieza. Hasta músicos expertos 
pueden discrepar sobre cuál debería ser la velocidad de zapateo. Pero 
siempre están de acuerdo en la velocidad subyacente a la que se despliega la 
pieza, llamada también tempo; las discrepancias son sólo respecto a 
subdivisiones o supradivisiones de ese ritmo subyacente. 

«Straight Up» de Paula Abdul y «Back in Black» de AC/DC tienen un 
tempo de 96, lo que significa que hay 96 tiempos por minuto. Si bailas 


«Straight Up» o «Back in Black», es probable que bajes un pie 96 veces por 
minuto o quizá 48, pero no 58 o 69. En «Back in Black» puedes oír al 
batería tocando un tiempo en sus platillos al principio mismo, constante, 
deliberadamente, a 96 tiempos exactos por minuto. «Walk This Way» de 
Aerosmith, tiene un tempo de 112, «Billie Jean» de Michael Jackson, de 
116, y «Hotel California» de los Eagles, de 75. 

Dos canciones pueden tener el mismo tempo pero producir una 
sensación diferente. En «Back in Black», el batería toca los platillos dos 
veces por cada tiempo (ocho notas) y el bajo toca a un ritmo simple 
sincopado perfectamente acompasado con la guitarra. En «Straight Up» 
pasan tantas cosas que es difícil describirlas con palabras. La batería toca 
una pauta compleja e irregular con tiempos tan rápidos como dieciséis 
notas, pero no continuamente...; el «aire» entre percusiones produce un 
sonido típico de la música funk y hip-hop. El bajo sigue una línea melódica 
compleja y sincopada que a veces coincide con la batería y a veces llena sus 
huecos. En el altavoz apropiado (o en el oído apropiado de los auriculares) 
oímos el único instrumento que marca el tiempo en cada tiempo: un 
instrumento latino que se llama afuche o cabasa, que suena como papel de 
lija o como judías dentro de una calabaza. Emplazar el ritmo más 
importante en un instrumento ligero de tono agudo es una técnica rítmica 
innovadora que revoluciona las convenciones rítmicas normales. Mientras 
pasa todo eso, sintetizadores, guitarra y efectos especiales de percusión 
entran y salen volando de la canción de manera espectacular, resaltando 
ciertos tiempos una y otra vez para añadir emoción. Como es difícil preveer 
o memorizar dónde están muchos de ellos, la canción ejerce un atractivo 
seguro sobre muchos, muchísimos oyentes. 

El tempo es un factor importante para transmitir emoción. Las 
canciones con tempos rápidos tienden a considerarse alegres, y las que 
tienen tempos lentos, tristes. Aunque esto es una simplificación excesiva, se 
cumple en una gama notable de circunstancias, en muchas culturas y a lo 
largo de la vida de un individuo. El individuo medio parece tener una 
memoria notable para el tempo. En un experimento que publicamos Perry 
Cook y yo en 1996 pedimos a la gente que cantase sus canciones populares 
y de rock favoritas de memoria. Lo que queríamos saber era lo que se 


aproximaban al tempo real de las versiones grabadas de esas mismas 
canciones. Como línea base, consideramos cuánta variación de tempo podía 
detectar el individuo medio; resulta ser del 4 por ciento. Dicho de otro 
modo, para una canción con un tempo de 100 tiempos por minuto, si el 
tempo varía entre 96-100, la mayoría de la gente, incluso algunos músicos 
profesionales, no detectarán este pequeño cambio (aunque la mayoría de los 
baterías, sí: su trabajo exige que sean más sensibles al tempo que otros 
músicos, porque son responsables de mantenerlo cuando no hay ningún 
director que lo haga por ellos). La mayoría de las personas que tomaron 
parte en nuestro estudio (y no eran músicos) fueron capaces de cantar 
canciones dentro del 4 por ciento de su tempo nominal. 

Es probable que la base neuronal de tan sorprendente precisión esté en 
el cerebelo, que se cree que contiene un sistema de cronómetros para 
nuestras vidas diarias y para sincronizar con la música que oímos. Esto 
significa que el cerebelo es capaz de recordar de algún modo los «arreglos» 
que utiliza para sincronizar con la música cuando la oímos, y puede 
recordar esos arreglos cuando queremos cantar una canción de memoria. 
Eso nos permite sincronizar lo que cantamos con un recuerdo de la última 
vez que lo cantamos. También es casi seguro que los ganglios basales (lo 
que Gerald Edelman ha llamado «los órganos de la sucesión») participen 
generando el ritmo, el tempo y el compás. 

«Compás» alude a cómo se agrupan los pulsos o tiempos. 
Generalmente, cuando zapateamos o taconeamos siguiendo la música, hay 
algunos tiempos que nos parecen más fuertes que otros. Da la impresión de 
que los músicos tocan ese tiempo más fuerte y con más intensidad que los 
otros. Ese tiempo más fuerte y más intenso es perceptualmente dominante, 
y los otros que le siguen son más débiles, hasta que llega otro fuerte. Todos 
los sistemas musicales que conocemos tienen pautas de tiempos fuertes y 
débiles. La más común en la música occidental es para los tiempos fuertes 
que se produzcan una vez Cada cuatro: FUERTE-débil-débil-débil 
FUERTE-débil-débil-débil. El tercer tiempo en una pauta de cuatro suele 
ser algo más fuerte que el segundo y el cuarto: hay una jerarquía de 
intensidades, en la que el primero es el más fuerte, luego el tercero y le 
siguen el segundo y el cuarto. Con una frecuencia algo menor se produce el 


tiempo fuerte una vez de cada tres en lo que llamamos el tiempo de «vals»: 
FUERTE-débil-débil FUERTE-débil-débil. Normalmente también 
contamos esos tiempos de un modo que destaca cuál es el fuerte: UNO-dos- 
tres-cuatro, UNO-dos-tres-cuatro, o UNO-dos-tres, UNO-dos-tres. 

Por supuesto la música sería aburrida si sólo tuviésemos esos tiempos 
directos. Podríamos dejar uno fuera para añadir tensión. Pensemos en 
«Twinkle, Twinkle Little Star» escrito por Mozart cuando tenía seis años. 
No aparecen notas en cada tiempo: 


UNO-dos-tres-cuatro 
UNO-dos-tres-(silencio) 
UNO-dos-tres-cuatro 
UNO-dos-tres-(silencio): 


TWIN-kle twinkle 

LIT-tle star (silencio) 
HOW-I won-der 

WHAT you are (silencio). 


Una canción de cuna escrita con la misma melodía, «Ba Ba Black Sheep», 
UNO-dos-tres-cuatro, se puede dividir en partes más pequeñas y más 
interesantes: 


BA ba black sheep 
HAVE-you-any-wool ? 


Adviértase que cada sílaba en «have-you-any» va el doble de rápido que las 
sílabas «ba ba black». Las notas de la cuarta han sido divididas a la mitad y 
podemos contar esto como 


UNO-dos-tres-cuatro 
UNO-y-dos-y-tres-(silencio). 


En «Jailhouse Rock», interpretado por Elvis Presley y escrito por dos 
compositores sobresalientes de la época del rock, Jerry Leiber y Mike 


Stoller, el tiempo fuerte se produce en la primera nota que canta Presley, y 
luego en cada cuarta nota después de ésa: 


[verso 1:] WAR-den threw a party at the 

[verso 2: ] COUN-ty jail (silencio) the 

[verso 3:] PRIS-on band was there and they be- 
[verso 4:] GAN to wail. 


En la música con letra, las palabras no siempre se alinean exactamente con 
los primeros tiempos del compás; en «Jailhouse Rock» parte de la palabra 
began empieza antes de un tiempo fuerte y termina en ese tiempo fuerte. En 
la mayoría de las canciones infantiles y de las canciones populares 
sencillas, como por ejemplo «Ba Ba Black Sheep» o «Frere Jacques», no 
ocurre eso. Esta técnica lírica funciona especialmente bien en «Jailhouse 
Rock» porque al pronunciarlo el acento está en la segunda sílaba de began; 
extendiendo así la palabra a la línea siguiente se da un impulso 
suplementario a la canción. 

Por convención, en la música occidental tenemos nombres para las 
duraciones de las notas similares a las que tenemos para los intervalos 
musicales. Un intervalo de una «quinta perfecta» es un concepto relativo: 
puede empezar en una nota cualquiera y luego, por definición, notas que 
son bien siete semitonos más altas o siete semitonos más bajas se 
consideran una quinta perfecta aparte de la nota inicial. La duración 
estándar se denomina una redonda y dura cuatro tiempos, de forma 
independiente de lo lenta o rápida que se esté moviendo la música..., es 
decir, independientemente del tempo. (En un tempo de sesenta pulsos, como 
en la Marcha fúnebre, cada tiempo dura un segundo, de manera que una 
entera duraría cuatro segundos.) Una nota con la mitad de la duración de 
una redonda se denomina una blanca, y una nota la mitad de larga que la 
media nota se llama una negra. Para la música popular y folclórica, en 
general el tiempo básico es una negra. Decimos de esas canciones que son 
de compás 4/4: el numerador nos dice que la canción está organizada en 
grupos de cuatro notas, y el denominador nos dice que la longitud de la nota 
básica es de una negra. En la notación y cuando hablamos de ellos, 


denominamos a cada uno de estos grupos de cuatro notas una medida o una 
barra. Una medida con un compás de 4/4 tiene cuatro tiempos, y cada 
tiempo es una negra. Esto no implica que la única duración de la nota en la 
medida sea una negra. Podemos tener notas de cualquier duración, o 
silencios..., es decir, ninguna nota en absoluto; la indicación 4/4 sólo 
intenta describir cómo contamos los tiempos. 

«Ba Ba Black Sheep» tiene cuatro negras en su primera medida, y luego 
corcheas (la mitad de la duración de una negra) y un silencio de una negra 
en la segunda medida. He utilizado el símbolo 1 para indicar una negra y L 
para indicar una corchea, y he mantenido el espacio entre sílabas 
proporcional al tiempo que se asigna a ellas: 


[medida 1:]ba ba black sheep 


[medida 2:] have you an-y  wool (silencio) 


A E 18 A 


Puedes ver en el diagrama que las corcheas van el doble de rápido que las 
negras. 

En «That'1l Be the Day» de Buddy Holly, la canción empieza con una 
nota introductoria; el tiempo fuerte se produce en la nota siguiente y luego 
en Cada negra que sigue a ésa, lo mismo que en «Jailhouse Rock»: 


THAT"Il be the day (silencio) when 
YOU say good-bye-yes; 

THAT"Il be the day (silencio) when 
YOU make me cry-hi; you 

SAY you gomna leave (silencio) you 
KNOW it's a lie "cause 

THAT”Il be the day-ay- 

AY when 1 die. 


Fíjate en cómo Holly, igual que Elvis, corta una palabra en dos entre versos 
(day en las dos últimas líneas). Para la mayoría de la gente, el tactus es 
cuatro tiempos entre los tiempos iniciales de esta canción, y golpearán con 


el pie cuatro veces de un primer tiempo al siguiente. Aquí, todas las 
mayúsculas indican el primer tiempo como antes, y la negrita indica 
cuándo darás en el suelo con el pie: 


Well 

THAT”|l be the day (silencio) when 
YOU say good-bye-yes; 

THAT”|l be the day (silencio) when 
YOU make me cry-hi; you 

SAY you gonna leave (silencio) you 
KNOW its a lie "cause 

THAT”|l be the day-ay- 

AY when 1 die. 


Si prestas atención detenida a la letra de la canción y a sus relaciones con 
los tiempos, te darás cuenta de que se produce un golpe con el pie en el 
medio de alguno de ellos. El primer say del segundo verso empieza en 
realidad antes de que bajes el pie: lo más probable es que tengas el pie en el 
aire cuando empiece la palabra say, y lo bajes en mitad de ella. Pasa lo 
mismo luego con la palabra yes en el mismo verso. Cuando una nota se 
anticipa a un tiempo (es decir, cuando un músico toca una nota un poco 
antes del tiempo propiamente dicho) eso se llama síncopa. Se trata de un 
concepto muy importante que se relaciona con la expectación, y en último 
término con el impacto emocional de una canción. La síncopa nos coge por 
sorpresa y añade emoción. 

Como sucede con muchas canciones, algunas personas captan «That?”11 
Be the Day» a mitad de compás; no hay nada malo en esto (es una 
interpretación distinta y válida) y golpean con el pie dos veces en el mismo 
tiempo en que otra gente lo hace cuatro veces: una vez en el tiempo inicial y 
de nuevo dos tiempos más tarde. 

La canción empieza en realidad con la palabra Well, que surge antes de 
un primer tiempo: esto se llama una nota introductoria. Holly utiliza dos 
palabras, Well, you, como notas introductorias para el verso, también, y 


luego inmediatamente después de ellas entramos en sintonía de nuevo con 
los primeros tiempos: 


[nota introductoria] Well, you 

[verso 1] GAVE me all your lovin” and your 
[verso 2] (SILENCIO) tur-tle dovin” (silencio) 
[verso 3] ALL your bugs and kisses and your 
[verso 4] (SILENCIO) money too. 


Lo que hace Holly aquí es tan inteligente que viola nuestras 
expectativas no sólo con anticipaciones, sino retrasando palabras. 
Normalmente, habría una palabra en cada primer tiempo, como en las 
canciones infantiles. Pero en los versos dos y cuatro de la canción llega el 
primer tiempo y ¡él se calla! Ésta es otra forma de la que los compositores 
se sirven para crear emoción, al no darnos aquello que normalmente 
esperaríamos. 

Cuando la gente bate palmas o chasquea los dedos con la música, y a 
veces de una forma completamente espontánea y sin aprendizaje, mantienen 
el compás de una forma diferente a como lo harían con los pies: baten 
palmas o chasquean los dedos no en el primer tiempo, sino en el segundo o 
en el cuarto. Éste es el llamado backbeat, un contratiempo fuerte, del que 
habla Chuck Berry en su canción «Rock and Roll Music». 

John Lennon dijo que la esencia de la composición de canciones de rock 
era para él «decir sólo lo que es, en lenguaje sencillo, hacerlo rimar y poner 
en ello un backbeat». En «Rock and Roll Music» (que John cantó con los 
Beatles), como en la mayoría de las canciones de rock, ese contratiempo 
fuerte es lo que hace la caja clara: la caja clara toca sólo en el segundo y el 
cuarto tiempo de cada compás, en oposición al tiempo fuerte del primero, y 
al secundario, del tercero. Este contratiempo fuerte, el backbeat, es el 
elemento rítmico característico de la música rock, y Lennon lo utilizó 
mucho, por ejemplo en «Instant Karma» (*golpe* indica abajo donde se 
toca la caja clara en la canción, con el backbeat): 


Instant karma's gonna get you 
(silencio) *golpe* (silencio) *golpe* 


«Gonna knock you right on the head» 
(silencio) *golpe* (silencio) *golpe* 

But we all *golpe* shine *golpe* 

on *golpe* (silencio) *golpe* 

Like the moon *golpe* and the stars *golpe* 
and the sun *golpe* (silencio) *golpe*. 


En «We Will Rock You» de Queen, oímos lo que suena como el zapateo en 
las gradas de los estadios dos veces seguidas (bum-bum) y luego batir de 
palmas (CLAP) en un ritmo repetido: bum-bum-CLAP, bum-bum-CLAP); el 
CLAP es el backbeat. 

Pensemos ahora en la marcha de John Philip Sousa, «The Stars and 
Stripes Forever». Si puedes oírla mentalmente, puedes taconear siguiendo el 
ritmo mental. Mientras la música hace «DAH-dah-ta Dum-dum dah DUM- 
dum dum-dum DUM», tus pies taconearán ABAJO-arriba ABAJO-arriba 
ABAJO-arriba ABAJO-arriba. En esta canción, es natural golpear con el 
pie por cada dos negras. Decimos que esta canción está «en dos», queriendo 
decir que la agrupación natural de ritmos es dos negras por tiempo. 

Pensemos ahora en «My Favorite Things» (letra y música de Richard 
Rodgers y Oscar Hammerstein). Esta canción está en el compás del vals, o 
lo que se llama compás de 3/4. Los tiempos parecen disponerse en grupos 
de tres, con uno fuerte seguido de dos débiles. «RAIN-drops-on ROSE-es 
and WHISK-ers-on KIiT=tens (silencio).» UNO-dos-tres UNO-dos-tres 
UNO-dos-tres UNO-dos-tres. 

Igual que con el tono, las proporciones de duraciones de enteros 
pequeños son las más comunes, y se acumulan pruebas de que son más 
fáciles de procesar neurológicamente. Pero, como indica Eric Clarke, las 
proporciones de enteros pequeños casi nunca se encuentran en muestras de 
música real. Esto indica que durante nuestro procesamiento neurológico del 
compás musical se produce un proceso de cuantización (equiparación de 
duraciones). El cerebro trata las duraciones que son similares como iguales, 
redondeando unas hacia arriba y otras hacia bajo con el fin de tratarlas 
como simples proporciones de enteros como 2:1, 3:1 y 4:1. Algunos 
músicos utilizan proporciones más complejas; Chopin y Beethoven utilizan 


proporciones nominales de 7:4 y 5:4 en algunas de sus obras de piano, en 
que se tocan siete o cinco notas con una mano mientras se tocan cuatro con 
la otra. Como en el caso del tono, es posible teóricamente cualquier 
proporción, pero hay limitaciones a lo que podemos percibir y recordar, y 
hay limitaciones basadas en el estilo y en la convención. 

Los tres compases más comunes de la música occidental son: 4/4, 2/4 y 
3/4. Existen otras agrupaciones rítmicas, como 5/4, 7/4 y 9/4. Un compás 
bastante común es 6/8, en el que contamos seis tiempos para una medida, y 
a Cada corchea le corresponde uno. Es similar al 3/4 del vals; la diferencia 
es que el compositor pretende que los músicos «sientan» la música en 
grupos de seis en vez de en grupos de tres, y que el tiempo subyacente sea 
la corchea de más corta duración en vez de una negra. Esto indica la 
jerarquía que existe en las agrupaciones musicales. Es posible contar 6/8 
como grupos de 3/8 (UNO-dos-tres UNO-dos-tres) o como un grupo de seis 
(UNO-dos-tres-CUATRO-cinco-seis) con un acento secundario en el cuarto 
tiempo, y para la mayoría de la audiencia éstas son sutilezas sin interés que 
sólo preocupan a un intérprete. Pero puede haber diferencias cerebrales. 
Sabemos que hay circuitos neuronales especialmente relacionados con la 
detección y el rastreo del compás musical, y sabemos que el cerebelo 
participa en la composición de un reloj interno o cronómetro capaz de 
sincronizar con acontecimientos fuera del mundo exterior. Nadie ha hecho 
aún el experimento de ver si 6/8 y 3/4 tienen representaciones neuronales 
diferentes, pero dado que los músicos las tratan realmente como diferentes, 
es muy probable que el cerebro lo haga también. Un principio fundamental 
de la neurociencia cognitiva es que el cerebro proporciona la base biológica 
para todas las conductas o pensamientos que experimentamos, y tiene que 
haber diferenciación neuronal, por ello, a cierto nivel, siempre que haya 
diferenciación conductual. 

Por supuesto, los tiempos de 4/4 y 2/4 son fáciles para caminar, para 
bailar o para la marcha porque (al tratarse de números pares) siempre 
acabas dando un golpe fuerte en el suelo con el mismo pie. Tres por cuatro 
es menos natural para caminar; nunca verás un cuerpo militar o una división 
de infantería marchando a 3/4. El tiempo cinco por cuatro se utiliza de vez 
en cuando, siendo el ejemplo más famoso el tema de Lalo Shiffrin de 


Misión imposible y la canción de Dave Brubeck «Take Five». Cuando 
cuentas el tiempo y taconeas con esas canciones, verás que los ritmos 
básicos se agrupan en cincos: UNO-dos-tres-cuatro-cinco, UNO-dos-tres- 
cuatro-cinco. Hay un tiempo fuerte secundario en la composición de 
Brubeck en el cuatro: UNO-dos-tres-CUATRO-cinco. En este caso, muchos 
músicos piensan que el 5/4 consiste en alternar los tiempos 3/4 y 2/4. En 
«Misión imposible», no hay ninguna división clara del cinco. Tchaikovsky 
utiliza el tiempo 5/6 para el segundo movimiento de su Sexta Sinfonía. Pink 
Floyd utilizó 7/4 para su canción «Money», como Peter Gabriel para 
«Salisbury Hill»; si intentas taconear o ir contando, necesitarás contar siete 
entre cada tiempo fuerte. 


He dejado el análisis de la intensidad casi para el final, porque no hay en 
realidad mucho que decir sobre la intensidad en cuanto a definición que la 
mayoría de la gente no sepa ya. Una cuestión chocante es que la intensidad, 
como el tono, es un fenómeno totalmente psicológico, es decir, sólo existe 
en la mente. Y esto es así por la misma razón que sólo existe en la mente la 
altura de tono. Cuando ajustas el volumen de tu sistema estéreo, estás 
aumentando técnicamente la amplitud de la vibración de las moléculas, lo 
que a su vez nuestro cerebro interpreta como intensidad. La cuestión aquí es 
que hace falta un cerebro para experimentar lo que nosotros llamamos 
«intensidad». Esto puede parecer en gran medida una distinción semántica, 
pero es importante mantener los términos claros. En la representación 
mental de la intensidad existen varias anomalías extrañas, como por 
ejemplo que las intensidades no son aditivas del modo que lo son las 
amplitudes (la intensidad, como el tono, es logarítmica) o el fenómeno de 
que la altura de un tono sinusoidal varía en función de su amplitud, o el 
descubrimiento de que puede parecer que los sonidos son más intensos de 
lo que son cuando han sido procesados electrónicamente de determinados 
modos (como la compresión de ámbito dinámico), algo que se hace a 
menudo en la música heavy metal. 

La intensidad se mide en decibelios (es decir, la décima parte de un 
belio, llamados así por Alexander Graham Bell y abreviado dB) y es una 
unidad sin dimensión como el tanto por ciento; indica una proporción de 


dos niveles sonoros. En este sentido, es similar a hablar de intervalos 
musicales, pero no de nombres de notas. La escala es logarítmica, y si se 
duplica la intensidad de una fuente sonora se produce un aumento de sonido 
de 3 dB. La escala logarítmica es útil para analizar el sonido debido a la 
extraordinaria sensibilidad del oído: la proporción entre el sonido más 
fuerte que podemos oír sin una lesión permanente y el más suave que 
podemos detectar es de un millón a uno; si se mide como niveles de presión 
sonora en el aire, en la escala dB eso es 120 dB. La gama de intensidad que 
podemos percibir se llama la gama dinámica. A veces los críticos hablan de 
la gama dinámica que se consigue en una grabación de música de alta 
Calidad; si una grabación tiene una gama dinámica de 90 dB, significa que 
la diferencia entre las partes más suaves de la grabación y las partes más 
fuertes es de 90 dB, que la mayoría de los expertos consideran alta fidelidad 
y que queda fuera de la capacidad de la mayoría de los sistemas de audio 
domésticos. 

Nuestros oídos comprimen los sonidos que son muy fuertes con la 
finalidad de proteger los elementos delicados de su parte media e interna. 
Normalmente, cuando se eleva la intensidad de los sonidos en el exterior, 
nuestra percepción aumenta de forma proporcional. Pero cuando llegan a 
ser realmente fuertes, un aumento proporcional en la señal transmitida por 
el tímpano causaría una lesión irreversible. La compresión de los niveles 
sonoros (o la gama dinámica) significará que los grandes aumentos de nivel 
sonoro en el exterior generan cambios de nivel mucho más pequeños en 
nuestros oídos. Las células capilares internas tienen una gama dinámica de 
50 decibelios, y sin embargo podemos oír hasta una gama dinámica de 120 
decibelios. Por cada aumento de cuatro decibelios en el nivel sonoro, las 
células capilares internas transmiten un aumento de un decibelio. La 
mayoría podemos apreciar cuándo se está produciendo esa compresión; los 
sonidos comprimidos tienen un timbre distinto. 

Los especialistas en acústica han ideado un medio para que resulte fácil 
hablar de niveles de sonido en el entorno. Como los decibelios expresan una 
proporción entre dos valores, eligieron un nivel de referencia estándar 
(veinte micropascales de presión sonora), que es aproximadamente igual al 
umbral de audición humana para la mayoría de los individuos sanos: el 


sonido de un mosquito volando a tres metros de distancia. Para evitar 
confusión, cuando se utilizan decibelios para reflejar este punto de 
referencia de nivel de presión sonora, nos referimos a ellos como decibelios 
NPL. He aquí algunos hitos para niveles sonoros, expresados en decibelios 
NPL: 


O decibelios mosquito volando en una habitación tranquila, a tres 
metros de distancia de tus oídos 


20 decibelios un estudio de grabación o una oficina muy tranquila 


35 decibelios una oficina tranquila típica con la puerta cerrada y los 
ordenadores apagados 


50 decibelios conversación típica en una habitación 
75 decibelios un nivel de audición de música con auriculares cómodo 


característico 

100-105 dB concierto de ópera o de música clásica durante pasajes de 
mucha intensidad sonora; algunos reproductores portátiles 
van a 105 dB 

110 dB un martillo neumático a 90 centímetros de distancia 

120 dB el motor de un reactor oído en la pista a treinta metros de 


distancia; un típico concierto de rock 
126-130 dB umbral de dolor y lesión; un concierto de rock de los Who 


(hay que tener en cuenta que 126 dB es cuatro veces más 
intenso que 120 dB) 


180 dB el lanzamiento de un transbordador espacial 
250-275 dB centro de un tornado; erupción volcánica 


Los tapones de espuma para los oídos pueden bloquear unos 25 dB de 
sonido, aunque no lo hacen a lo largo de toda la gama de frecuencias. Unos 
tapones pueden reducir al mínimo el peligro de lesión permanente en un 
concierto de los Who rebajando los niveles que llegan al oído en torno a los 
100-110 dB NPL. El tipo de protector auricular que se coloca sobre la oreja 
y que se utiliza en los campos de tiro y entre el personal del servicio de 
aterrizaje de los aeropuertos suele estar complementado con tapones en los 
oídos para proporcionar máxima protección. 


Hay mucha gente a la que le gusta la música muy alta. Los que van a los 
conciertos hablan de un estado especial de conciencia, un estado de 
estremecimiento y emoción, cuando la música está muy alta, a partir de los 
115 dB. Aún no sabemos por qué sucede eso. Puede estar relacionado en 
parte con el hecho de que la música muy fuerte satura el sistema auditivo, 
haciendo que las neuronas se activen al máximo. Cuando hay muchas, 
muchísimas neuronas activadas al máximo, se puede desencadenar una 
propiedad emergente, una condición cerebral cualitativamente distinta de 
cuando se activan a niveles normales. Aun así, hay gente a la que le gusta la 
música muy alta y gente a la que no. 

La intensidad es uno de los siete elementos importantes de la música 
junto con el tono, el ritmo, la melodía, la armonía, el tempo y el compás. 
Cambios muy pequeños en la intensidad tienen efectos profundos sobre la 
comunicación emotiva de la música. Un pianista puede tocar cinco notas al 
mismo tiempo pero de forma que una de ellas sea ligeramente más fuerte 
que las otras, otorgándole así un papel completamente distinto en nuestra 
percepción global del pasaje. La intensidad es también una clave importante 
para los ritmos, como vimos antes, y para el compás, porque es la 
intensidad de las notas la que determina cómo se agrupan rítmicamente. 


Hemos recorrido ya un círculo completo y volvemos al amplio tema de la 
altura de tono. El ritmo es un juego de expectativas. Cuando zapateamos 
estamos previendo qué va a suceder después en la música. También 
practicamos un juego de expectativas en la música con el tono. Sus reglas 
son tonalidad y armonía. Una tonalidad musical es el contexto tonal de una 
pieza de música. No todas las músicas tienen una tonalidad. Los tambores 
africanos, por ejemplo, no la tienen, ni tampoco compositores 
contemporáneos de música dodecafónica, como  Schónberg. Pero 
prácticamente toda la música que oímos en la cultura occidental (desde los 
estribillos comerciales de la radio a la sinfonía más seria de Bruckner, desde 
la música gospel de Mahalia Jackson a la de los Sex Pistols) tiene un grupo 
básico de tonos que remite a un centro tonal, la tonalidad. Ésta cambia en el 
curso de la canción (a esto se le llama modulación), pero es en general, por 
definición, algo que se mantiene durante un período de tiempo 


relativamente largo en el desarrollo de la pieza, por lo general cuestión de 
minutos. 

Si una melodía está basada en la escala do mayor, por ejemplo, decimos 
generalmente que la melodía está «en la tonalidad de do». Significa que la 
melodía tiene un impulso de regreso a la nota do, e incluso, aunque no 
acabe en do, esa nota es lo que los oyentes mantienen en su pensamiento 
como la nota dominante y focal de toda la pieza. El compositor puede 
utilizar temporalmente notas de fuera de la escala de do mayor, pero 
nosotros las identificamos como desviaciones, algo así como un corte 
rápido de una película a una escena paralela o a una retrospectiva, en que 
sabemos que es inminente e inevitable un regreso a la línea argumental 
básica. (Para una explicación más detallada sobre la teoría de la música 
véase el Apéndice B.) 

El atributo del tono en la música funciona dentro de una escala o un 
contexto tonal/armónico. Una nota no siempre nos suena igual cuando la 
oímos: la oímos dentro del contexto de una melodía y de lo que ha llegado 
antes, y la oímos dentro del contexto de la armonía y los acordes que la 
acompañan. Podemos compararlo para entenderlo mejor con un sabor: el 
orégano sabe bien con berenjena o salsa de tomate, y puede que algo peor 
con budín de plátano. La nata adquiere un gusto distinto con fresas que 
cuando se la mezcla con café o se añade a un aderezo de ensalada con ajo. 

En «For No One» de los Beatles, se canta la melodía en una nota para 
dos compases, pero los acordes que acompañan a esa nota cambian, dándole 
un carácter distinto y un sonido distinto. La canción «One Note Samba» de 
Antonio Carlos Jobim contiene en realidad muchas notas, pero hay una que 
aparece a lo largo de la canción con acordes cambiantes acompañándola, y 
oímos una variedad de matices diferentes de contenido musical cuando se 
despliega en la composición. En algunos contextos de acordes, la nota 
suena alegre y feliz, en otros, melancólica. En otra cosa en la que la 
mayoría somos expertos, aunque no seamos músicos, es en reconocer 
progresiones familiares de acordes, incluso en ausencia de la melodía bien 
conocida. Siempre que los Eagles tocan esta progresión de acordes: 


si menor/fa sostenido mayor/la mayor/mi mayor/sol mayor/re mayor/mi menor/fa sostenido 
mayor 


no tienen más que tocar tres acordes para que miles de aficionados del 
público que no son músicos sepan que van a tocar «Hotel California». Y a 
pesar de que han cambiado la instrumentación a lo largo de los años, 
pasando de guitarras eléctricas a acústicas, de las de doce cuerdas a otras de 
seis cuerdas, la gente reconoce esos acordes; los reconocemos incluso 
cuando suenan en una orquesta en altavoces baratos en el hilo musical del 
consultorio del dentista. 

El tema de las escalas y de mayor y menor está relacionado con el de la 
disonancia y la consonancia tonales. Algunos sonidos nos resultan 
desagradables, aunque no siempre sabemos por qué. Raspar con las uñas en 
un encerado es un ejemplo clásico, pero parece ser desagradable sólo para 
los humanos; a los monos no parece importarles (o al menos en un 
experimento que se hizo, les gustaba ese sonido tanto como la música rock). 
En música, hay gente que no puede soportar el sonido de las de guitarras 
eléctricas distorsionadas; otros no escucharían otra cosa. Al nivel armónico 
(es decir, el de las notas, más que de los timbres participantes) a algunos les 
resultan particularmente desagradables determinados intervalos o acordes. 
Los músicos llaman a los intervalos y acordes de sonido agradable 
consonantes y a los desagradables disonantes. Se ha investigado mucho 
sobre el tema de por qué nos resultan consonantes ciertos intervalos y otros 
no, y no hay actualmente ningún acuerdo al respecto. De momento hemos 
conseguido llegar a saber que el tallo cerebral y el núcleo coclear dorsal 
(estructuras primitivas que tienen todos los vertebrados) pueden diferenciar 
entre consonancia y disonancia. Y esta distinción surge antes de que 
participe el nivel más elevado, la región cerebral humana, el córtex. 

Aunque los mecanismos neurológicos en que se basan la consonancia y 
la disonancia siguen sin estar claros, existe un acuerdo generalizado sobre 
algunos de los intervalos que se consideran consonantes. Un intervalo 
unísono (la misma nota tocada consigo misma) se considera consonante, lo 
mismo que una octava. Esto crea proporciones de frecuencias enteras 
simples de 1:1 y 2:1 respectivamente. (Desde el punto de vista de la 
acústica, la mitad de los picos del gráfico de onda para octavas se alinean 
perfectamente entre sí, la otra mitad cae justo entre dos picos.) Es curioso 
que si dividimos la octava justo por la mitad, el intervalo con el que 


acabamos se llama un tritono, y a la mayoría de la gente le resulta el 
intervalo más desagradable que existe. En parte la razón que lo explica 
quizá tenga que ver con el hecho de que el tritono no procede de una 
proporción de entero simple, ya que es de 43:32. Podemos enfocar la 
consonancia desde una perspectiva de proporción entera. Una proporción de 
3:1 es una proporción entera simple, y eso define dos octavas. Una de 3:2 es 
también una proporción entera simple, y define el intervalo de una quinta 
perfecta. Ésta es la distancia entre, por ejemplo, do y el sol de encima de 
ella. La distancia de sol al do de encima de ella forma un intervalo de una 
cuarta perfecta y su relación de frecuencia es 4:3. 

Las notas particulares que se encuentran en nuestra escala mayor se 
remontan a los antiguos griegos y a sus ideas sobre la consonancia. Si 
empezamos con una nota y nos limitamos a añadirle el intervalo de una 
quinta perfecta reiteradamente, acabamos generando una serie de 
frecuencias que están muy próximas a la escala mayor actual: do - sol - re - 
la - mi - si - fa sostenido - do sostenido - sol sostenido - re sostenido - la 
sostenido - mi sostenido (o fa) y luego vuelta a do. Esto se conoce como el 
círculo de quintas, porque después de recorrer el ciclo, acabamos de nuevo 
en la nota con la que empezamos. Curiosamente, si seguimos la serie 
armónica, podemos generar frecuencias con una cierta proximidad también 
a la escala mayor. 

Una sola nota no puede ser, por sí sola, disonante, pero puede resultarlo 
con un fondo de ciertos acordes, sobre todo cuando éstos implican una 
tonalidad de la que no forma parte la nota única. Dos notas pueden resultar 
disonantes juntas, tanto si se tocan simultáneamente como en sucesión, si la 
sucesión no se ajusta a las costumbres que hemos aprendido que se 
corresponden con nuestros idiomas musicales. Los acordes también pueden 
resultar disonantes, sobre todo cuando se extraen de fuera de la tonalidad 
establecida. Combinar todos estos factores es la tarea del compositor. La 
mayoría de nosotros somos oyentes muy discriminadores, y cuando el 
compositor no llega a lograr del todo el equilibrio, nuestras expectativas 
resultan traicionadas más de lo que podemos soportar y cambiamos de 
emisora de radio, nos quitamos los auriculares o simplemente salimos del 
local. 


He revisado ya los elementos importantes que intervienen en la música: 
tono, timbre, tonalidad, armonía, intensidad, ritmo, compás y tempo. Los 
neurocientíficos deconstruyen el sonido en sus componentes para estudiar 
de forma selectiva regiones cerebrales que participan en el procesamiento 
de cada uno de ellos, y los musicólogos analizan sus aportaciones 
individuales a la experiencia estética global de escuchar. Pero la música (la 
música real) triunfa o fracasa por la relación entre esos elementos. 
Compositores y músicos raras veces los tratan de forma aislada; saben que 
cambiar un ritmo puede exigir también cambiar el tono o la intensidad, o 
los acordes que acompañan a ese ritmo. Un enfoque del estudio de la 
relación entre esos elementos es el que remonta sus orígenes a finales del 
siglo xIx y a los psicólogos de la Gestalt. 

En 1890 a Christian von Ehrenfels le desconcertó algo que todos damos 
por supuesto y que sabemos hacer: la transposición melódica. La 
transposición consiste simplemente en cantar o tocar una canción en una 
tonalidad diferente o con alturas de tono diferentes. Cuando cantamos 
«Happy Birthday» nos limitamos a seguir a la primera persona que empezó 
a Cantar, y en la mayoría de los casos esa persona empieza con la nota que 
le parece. Podría haber empezado incluso en un tono que no sea de una nota 
reconocida de la escala musical, que cayese, digamos, entre do y do 
sostenido, y casi nadie se daría cuenta ni se preocuparía por ello. Canta esa 
canción tres veces por semana y es posible que cantes tres series de tonos 
completamente distintas. Cada versión de la canción se denomina una 
transposición de las otras. 

Los psicólogos de la Gestalt (Von Ehrenfels, Max Wertheimer, 
Wolfgang Kóhler, Kurt Koffka y otros) estaban interesados por el problema 
de las configuraciones, es decir, cómo se agrupan los elementos para formar 
conjuntos, objetos que son cualitativamente diferentes de la suma de sus 
partes, y que no pueden entenderse en función de sus partes. La palabra 
Gestalt ha pasado del alemán a las otras lenguas con el significado de una 
forma completa unificada, aplicable tanto a objetos artísticos como no 
artísticos. Se puede concebir un puente colgante como una Gestalt. Las 
funciones y la utilidad del puente no se comprenden fácilmente mirando las 


piezas de cables, tirantes, tornillos y vigas de acero; sólo cuando se agrupan 
todas en la forma de un puente podemos ver cómo un puente es diferente 
de, digamos, una grúa de la construcción que podría hacerse con las mismas 
piezas. También en la pintura es la relación entre los elementos un aspecto 
crítico del producto artístico final. El ejemplo clásico es un rostro: la Mona 
Lisa no sería lo que es si se pintasen los ojos, la nariz y la boca exactamente 
igual que son pero distribuidos en el lienzo en un orden distinto. 

Los psicólogos de la Gestalt se preguntaron cómo es que una melodía 
(compuesta por una serie de alturas de tono específicas) podía retener su 
identidad, su identificabilidad, incluso cambiando todas sus alturas de tono. 
Se trataba de un caso para el que no podían proponer una explicación 
teórica satisfactoria, el triunfo definitivo de la forma sobre sus 
componentes, del todo sobre las partes. Toca una melodía utilizando 
cualquier serie de tonos y mientras la relación entre esos tonos se mantenga 
constante, será la misma melodía. Tócala con instrumentos diferentes y la 
gente seguirá reconociéndola. '"Tócala a media velocidad o a velocidad 
doble, o aplica todas esas transformaciones al mismo tiempo y la gente 
seguirá sin tener el menor problema para identificarla como la canción 
original. La influyente escuela de la Gestalt se creó para aclarar esta 
cuestión concreta. Aunque nunca lograron aclararla, nos ayudaron mucho a 
comprender cómo están organizados los objetos del mundo visual, a través 
de una serie de reglas que se enseñan en todas las clases de introducción a 
la psicología, los llamados «principios gestálticos de agrupación». 

Albert Bregman, un psicólogo cognitivo de la Universidad McGill, ha 
realizado una serie de experimentos a lo largo de los últimos treinta años 
con vistas a elaborar una interpretación similar de los principios de 
agrupación del sonido. El teórico de la música Fred Lerdahl, de la 
Universidad de Columbia, y el lingiiista Ray Jackendoff, de la Universidad 
de Brandeis (ahora Universidad de Tufts) abordaron el problema de 
enunciar una serie de reglas similares a las de la gramática del lenguaje para 
la composición musical, incluyendo los principios de agrupación en la 
música. La base neurológica de estos principios no está establecida del 
todo, pero a través de una serie de inteligentes experimentos conductuales 
hemos llegado a saber mucho sobre la fenomenología de los principios. 


En la visión, la agrupación se remite a cómo se combinan o se 
mantienen separados entre sí los elementos en el mundo visual en nuestra 
imagen mental del mundo. La agrupación es en parte un proceso 
automático, lo que significa que gran parte de él sucede rápidamente en el 
cerebro sin que nos demos cuenta. Eso se ha descrito en lenguaje sencillo 
como el problema de «qué va con qué» en nuestro campo visual. Hermann 
von Helmholtz, el científico del siglo x1Ix que nos enseñó mucho de lo que 
hoy consideramos los fundamentos de la ciencia auditiva, lo describió como 
un proceso inconsciente que entrañaba inferencia, o deducciones lógicas 
sobre qué objetos del mundo es probable que se agrupen de acuerdo con 
una serie de características o atributos de los objetos. 

Si te encuentras en la cima de una montaña contemplando un paisaje 
variado, podrías describirlo diciendo que ves dos o tres montañas más, un 
lago, un valle, una fértil llanura y un bosque. Aunque el bosque esté 
compuesto por cientos o miles de árboles, éstos forman un grupo 
perceptual, distinto de otras cosas que vemos, no necesariamente por 
nuestro conocimiento de los bosques, sino porque los árboles comparten 
propiedades similares de forma, tamaño y color, al menos cuando 
contrastan con fértiles llanuras, lagos y montañas. Pero si estás en el interior 
de un bosque con una mezcla de alisos y pinos, la corteza blanca y lisa de 
los alisos les hará «destacarse» como un grupo separado de los pinos de 
corteza oscura y rugosa. Si te sitúo delante de un árbol y te pregunto qué 
ves, podrías empezar a centrarte en detalles de ese árbol: corteza, ramas, 
hojas (o agujas), insectos y musgo. Cuando miramos una extensión de 
césped, la mayoría de nosotros no individualizamos normalmente las 
briznas de hierba, aunque podamos hacerlo si centramos la atención en 
ellas. Agrupar es un proceso jerárquico y nuestros cerebros forman grupos 
perceptuales basándose en un gran número de factores. Algunos factores de 
agrupación son intrínsecos a los propios objetos: forma, color, simetría, 
contraste y principios que relacionan la continuidad de líneas y bordes del 
objeto. Otros factores de agrupación son psicológicos, es decir, tienen una 
base mental, y dependen, por ejemplo, de a qué  procuremos 
conscientemente prestar atención, de los recuerdos que tengamos del objeto 


o de otros objetos similares y de las expectativas que tengamos de cómo 
deberían unirse esos objetos. 

Los sonidos también se agrupan. Esto quiere decir que mientras algunos 
se agrupan, otros se separan. La mayoría de la gente no es capaz de aislar el 
sonido de uno de los violines de una orquesta de los demás, o de una de las 
trompetas de las otras trompetas: forman un grupo. De hecho, toda la 
orquesta puede formar un grupo perceptual único (llamado en la 
terminología de Bregman una corriente) dependiendo del contexto. Si estás 
en un concierto al aire libre con varios grupos tocando al mismo tiempo, los 
sonidos de la orquesta que está delante de ti se agruparán en una sola 
entidad auditiva, diferenciada de las otras orquestas que están detrás y al 
lado. A través de un acto de volición (atención) puedes luego centrarte sólo 
en los violines de la orquesta que tienes delante, igual que puedes seguir 
una conversación con una persona que está a tu lado en una habitación llena 
de gente y donde hay varias conversaciones. 

Un caso de agrupación auditiva es el de la integración de los diferentes 
sonidos que emanan de un instrumento musical en la percepción de un 
instrumento único. No oímos los armónicos individuales de un oboe o de 
una trompeta, oímos un oboe o una trompeta. Esto es especialmente notable 
si imaginas un oboe y una trompeta tocando al mismo tiempo. El cerebro es 
Capaz de analizar las docenas de secuencias diferentes que llegan a los 
oídos y de agruparlas exactamente de la forma adecuada. No tenemos la 
impresión de docenas de armónicos desencarnados, y oímos sólo un 
instrumento híbrido único. Lo que sucede en realidad es que el cerebro 
construye imágenes mentales diferenciadas de un oboe y de una trompeta, y 
también del sonido de los dos tocando juntos, la base de nuestra percepción 
de combinaciones tímbricas en la música. De esto era de lo que hablaba 
Pierce cuando se maravillaba ante los timbres de la música rock, los sonidos 
que hacían una batería eléctrica y una guitarra eléctrica cuando tocaban 
juntas, dos instrumentos perfectamente diferenciables entre sí, y que de 
forma simultánea creaban una nueva combinación sonora que se podía 
escuchar, analizar y recordar. 

Nuestro sistema auditivo explota la serie armónica agrupando sonidos. 
El cerebro coevolucionó en un mundo en el que muchos de los sonidos a los 


que se enfrentó nuestra especie (durante las decenas de miles de años de 
historia evolutiva) compartían entre sí ciertas propiedades acústicas, 
incluida la serie armónica tal como la entendemos hoy. A través de este 
proceso de «inferencia inconsciente» (así lo denominó Von Helmholtz), 
nuestros cerebros suponen que es sumamente improbable que estén 
presentes varias fuentes sonoras distintas y que cada una produzca un solo 
componente de la serie armónica. Nuestros cerebros utilizan más bien el 
«principio de probabilidad» de que tiene que ser un solo objeto el que 
produzca esos componentes armónicos. Todos nosotros podemos efectuar 
esas inferencias, incluso los que no son capaces de identificar o nombrar el 
instrumento «oboe» como distinto de, por ejemplo, un clarinete o un fagot, 
o incluso un violín. Pero de la misma manera que la gente que no conoce 
los nombres de las notas de la escala puede pese a ello decir cuándo se están 
tocando dos notas diferentes y no las mismas notas, casi todos nosotros 
(aunque no conozcamos los nombres de los instrumentos musicales) 
podemos decir cuándo están tocando dos instrumentos distintos. Nuestro 
modo de utilizar la serie armónica para agrupar sonidos contribuye mucho a 
explicar por qué oímos una trompeta en vez de los armónicos individuales 
que inciden en nuestros oídos: se agrupan como las hojas de hierba que nos 
dan la impresión de «césped». También explica cómo podemos diferenciar 
una trompeta de un oboe o cuándo tocan cada uno de ellos notas distintas: 
las diferentes frecuencias fundamentales dan origen a una serie diferente de 
armónicos y el cerebro es capaz de establecer sin problema qué va con qué, 
en un proceso de computación que recuerda lo que podría hacer un 
ordenador. Sin embargo, eso no explica cómo somos capaces de diferenciar 
una trompeta de un oboe cuando están tocando la misma nota, porque 
entonces los armónicos tienen casi la misma frecuencia (aunque con las 
distintas amplitudes características de cada instrumento). Para eso el 
sistema auditivo se basa en un principio de apariciones simultáneas. Los 
sonidos que empiezan juntos (en el mismo instante temporal) se perciben 
como sonidos que van juntos, en el sentido de agrupación. Y desde la época 
en que Wilhelm Wundt puso en marcha el primer laboratorio psicológico, 
en la década iniciada en 1870, se sabe que nuestro sistema auditivo es 
exquisitamente sensible a lo que significa simultáneo en ese sentido, y es 


Capaz de detectar diferencias en los momentos de inicio del sonido tan 
breves como unos cuantos milisegundos. 

Así que cuando una trompeta o un oboe están tocando la misma nota al 
mismo tiempo, nuestro sistema auditivo es capaz de determinar que están 
tocando dos instrumentos diferentes, porque el espectro sonoro total (la 
serie armónica) de un instrumento comienza tal vez unas cuantas milésimas 
de segundo antes que el espectro sonoro del otro. Esto es lo que se entiende 
por un proceso de agrupación que no sólo integra sonidos en un objeto 
único, sino que los segrega en objetos diferentes. 

Este principio de comienzos simultáneos puede considerarse de un 
modo más general como un principio de ubicación temporal. Agrupamos 
todos los sonidos que está haciendo la orquesta ahora en contraposición a 
los que hará mañana por la noche. El tiempo es un factor de la agrupación 
auditiva. El timbre es otro, y eso es lo que hace que resulte tan difícil 
distinguir un violín de los otros que están tocando al mismo tiempo, aunque 
los directores y músicos expertos puedan aprender a hacerlo. La ubicación 
espacial es un principio de agrupación, pues nuestros oídos tienden a 
agrupar sonidos que proceden de la misma posición relativa. No somos 
demasiado sensibles a la ubicación en el plano arriba-abajo, pero somos 
muy sensibles a ella en el plano izquierda-derecha y algo sensibles a la 
distancia en el plano adelante y atrás. El sistema auditivo supone que es 
probable que los sonidos que proceden de un lugar diferenciado del espacio 
formen parte del mismo objeto del mundo exterior. Ésta es una de las 
explicaciones de por qué podemos seguir una conversación en una 
habitación llena de gente con relativa facilidad: el cerebro está utilizando 
las claves de ubicación espacial de la persona con la que estamos 
conversando para bloquear otras conversaciones. También ayuda el que la 
persona con la que estamos hablando tenga un timbre único (el sonido de su 
vOz) que Opera como una clave de agrupación adicional. 

La amplitud afecta también a la agrupación. Sonidos de una intensidad 
similar se agrupan juntos, y es así como somos capaces de seguir las 
diferentes melodías de los divertimentos para instrumentos de viento de 
Mozart. Los timbres son todos muy similares, pero algunos instrumentos se 
tocan más fuerte que otros, creando en nuestro cerebro corrientes distintas. 


Es como si un filtro o cedazo recogiese el sonido del conjunto de los 
instrumentos de viento y lo diferenciase en partes distintas según la parte de 
la escala de intensidad en que estuviesen tocando. 

La frecuencia, o altura de tono, es una consideración firme y básica en 
la agrupación. Si has oído alguna vez una partita para flauta de Bach, hay 
momentos característicos en que algunas notas parecen «estallar» y 
separarse unas de otras, sobre todo cuando el flautista está tocando un 
pasaje rápido (el equivalente auditivo de un dibujo de «¿Dónde está 
Wally?»). Bach conocía la capacidad de las grandes diferencias de 
frecuencia de segregar los sonidos entre sí (bloquear o inhibir la 
agrupación) y compuso partes que incluyen grandes saltos de tono de una 
quinta perfecta o más. Las notas altas alternando con una sucesión de notas 
de tono más bajo forman una corriente diferenciada y crean en el oyente la 
ilusión de dos flautas tocando cuando sólo hay una. Sucede lo mismo en 
muchas de las sonatas de violín de Locatelli. Los cantores tiroleses, los 
yodelers, pueden conseguir el mismo efecto con sus voces combinando tono 
y Claves tímbricas; cuando un cantor tirolés varón salta a su registro de 
falsete, está haciendo al mismo tiempo un timbre diferenciado y, 
característicamente, un gran salto de tono, lo que hace que las notas más 
altas se separen de nuevo en una corriente perceptual diferenciada, creando 
la ilusión de dos personas que cantan piezas intercaladas. 

Sabemos ya que los subsistemas de los diferentes atributos del sonido 
que he descrito se separan muy pronto, a niveles bajos del cerebro. Esto 
parece indicar que la agrupación se efectúa a través de mecanismos 
generales que operan con una cierta independencia unos de otros. Pero está 
claro también que los atributos trabajan conjuntamente o enfrentados 
cuando se combinan de determinados modos, y sabemos también que la 
experiencia y la atención pueden tener una influencia en la agrupación, lo 
que sugiere que partes del proceso de agrupación se hallan bajo control 
cognitivo consciente. Aún sigue siendo objeto de debate cómo actúan juntos 
procesos conscientes e inconscientes (y los mecanismos cerebrales 
subyacentes a ellos), pero hemos avanzado mucho en su comprensión en los 
últimos siete años. Hemos llegado finalmente al momento en el que 
podemos señalar zonas específicas del cerebro que participan en aspectos 


concretos del procesamiento de la música. Hasta creemos saber qué parte 
del cerebro hace que prestes atención a las cosas. 

¿Cómo se forman los pensamientos? ¿Están «almacenados» los 
recuerdos en una zona determinada del cerebro? ¿Por qué las canciones se 
fijan en el pensamiento y no puedes librarte de ellas? ¿Experimenta algún 
placer enfermizo el cerebro en volverte loco lentamente con estúpidos 
estribillos publicitarios? Abordo esas y otras cuestiones en los capítulos 
siguientes. 
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TRAS EL TELÓN 


LA MÚSICA Y LA MÁQUINA MENTAL 


Para los científicos cognitivos, la palabra «mente» denomina esa parte de 
Cada uno de nosotros que encarna nuestras ideas, esperanzas, deseos, 
recuerdos, creencias y experiencias. El cerebro por otra parte es un órgano 
del cuerpo, una colección de células y agua, sustancias químicas y vasos 
sanguíneos, que reside en el cráneo. La actividad del cerebro da origen a los 
contenidos de la mente. Los científicos cognitivos usan a veces la analogía 
de que el cerebro es como la unidad central de procesamiento, o el 
hardware, de un ordenador, mientras que la mente es como los programas, O 
el software, que la hace funcionar. (Ojalá eso fuese literalmente cierto y 
pudiésemos ir corriendo a comprar una memoria de nivel superior.) Con 
esencialmente el mismo hardware pueden funcionar programas diferentes: 
de cerebros muy similares pueden surgir mentes distintas. 

La cultura occidental ha heredado una tradición de dualismo de René 
Descartes, que escribió que la mente y el cerebro son dos cosas 
completamente distintas. Los dualistas afirman que la mente preexistía 
antes del nacimiento del individuo, y que el cerebro no es la sede del 
pensamiento, que sólo es en realidad un instrumento de la mente que ayuda 
a implementar la voluntad de ésta, a mover músculos y a mantener la 
homeostasis en el cuerpo. No cabe duda de que la impresión mayoritaria es 
que la mente es algo único y distintivo, separado de lo que constituye sólo 
un conjunto de procesos neuroquímicos. "Tenemos la sensación de saber 
cómo es ser yo, cómo es lo de que yo esté leyendo un libro y cómo es lo de 


pensar en qué es ser yo. ¿Cómo puedo yo quedar reducido sin más a 
axones, dendritas y canales iónicos? Da la impresión de que somos algo 
más. 

Pero esa impresión podría ser ilusoria, igual que es indudable que la 
Tierra no se mueve, que no gira alrededor de su eje a mil seiscientos 
kilómetros por hora. La mayoría de los científicos y de los filósofos 
contemporáneos creen que el cerebro y la mente son dos partes de la misma 
cosa, y algunos creen que la distinción en sí es errónea. El punto de vista 
predominante hoy es que la suma total de tus pensamientos, creencias y 
experiencias está representada en pautas de activaciones (actividad 
electroquímica) en el cerebro. Si el cerebro deja de funcionar, la mente 
desaparece, pero el cerebro aún puede existir, sin pensamiento, en un 
recipiente del laboratorio de alguien. 

Los descubrimientos neuropsicológicos de especificidad regional de 
función son pruebas de esta idea. A veces, como consecuencia de un ataque 
(un bloqueo de vasos sanguíneos en el cerebro que conduce a la muerte 
celular), tumores, lesiones en la cabeza u otros traumas, una zona del 
cerebro resulta dañada. En muchos de esos casos, los daños en una región 
específica del cerebro provocan la pérdida de una función corporal o mental 
determinada. Cuando docenas o centenares de casos muestran pérdida de 
una función específica asociada con una región cerebral concreta, 
deducimos que esa región cerebral participa de algún modo en esa función 
o es quizá responsable de ella. 

Después de un siglo de investigaciones neuropsicológicas de este tipo 
hemos podido elaborar mapas de áreas de función del cerebro, y localizar 
operaciones cognitivas determinadas. La visión predominante del cerebro es 
que constituye un sistema computacional, y concebimos el cerebro como un 
tipo de ordenador. Redes de neuronas interconectadas efectúan 
computaciones sobre la información y la combinan de formas que originan 
pensamientos, decisiones, percepciones y en último término conciencia. 
Hay diferentes subsistemas que son responsables de diferentes aspectos de 
la cognición. La lesión en una zona del cerebro situada justo encima y 
detrás del oído izquierdo (área de Wernicke) provoca dificultades en la 
comprensión del lenguaje hablado; una lesión en una zona de la parte más 


alta de la cabeza (el córtex motriz) provoca dificultades para mover los 
dedos; el daño en una zona del centro del cerebro (el complejo 
hipocámpico) puede bloquear la capacidad para formar nuevos recuerdos 
dejando intactos sin embargo los viejos. El daño en un área situada justo 
detrás de la frente puede provocar cambios espectaculares de personalidad, 
y Causan la pérdida de ciertos rasgos. Esa localización de las funciones 
mentales es un sólido argumento científico en favor de la participación del 
cerebro en el pensamiento, y de la tesis de que los pensamientos proceden 
del cerebro. 

Sabemos desde 1848 (y el caso médico de Phineas Gage) que los 
lóbulos frontales están íntimamente relacionados con aspectos del yo y de la 
personalidad. Pero, incluso ciento cincuenta años después, casi todo lo que 
podemos decir sobre la personalidad y las estructuras neurológicas es vago 
y general. No hemos localizado la región del cerebro de la «paciencia» ni 
las regiones de la «envidia» ni de la «generosidad», y parece improbable 
que lleguemos a hacerlo alguna vez. El cerebro tiene una diferenciación 
regional de estructura y de función, pero es indudable que los atributos 
complejos de la personalidad están ampliamente distribuidos en él. 

El cerebro humano está dividido en cuatro lóbulos (el frontal, el 
temporal, el parietal y el occipital) además del cerebelo. Podemos hacer 
algunas toscas generalizaciones sobre función, pero en realidad la conducta 
es compleja y no se puede reducir fácilmente a simples cartografías. El 
lóbulo frontal está relacionado con la planificación y con el autocontrol, y 
con extraer sentido de las densas y entremezcladas señales que reciben 
nuestros sentidos: la llamada «organización perceptiva» que estudiaron los 
psicólogos de la Gestalt. El lóbulo temporal está asociado con la audición y 
la memoria. El lóbulo parietal lo está con los movimientos motrices y la 
habilidad espacial, y el lóbulo occipital con la visión. El cerebelo participa 
en las emociones y en la planificación de los movimientos y es la parte más 
antigua de nuestro cerebro desde el punto de vista evolutivo; hasta muchos 
animales, como los reptiles, que carecen de la región cerebral «superior» 
del córtex, tienen pese a ello un cerebelo. La separación quirúrgica de una 
porción del lóbulo frontal, el córtex prefrontal, del tálamo es lo que se llama 
una lobotomía. Así que cuando los Ramones cantan «Now 1 guess 1”11 have 


to tell ?em/That I got no cerebellum» [Supongo que ahora tendré que 
decirles/Que no tengo cerebelo] en su canción «Teenage Lobotomy» (letra y 
música de Douglas Colvin, John Cummings, Thomas Erdely y Jeffrey 
Hyman) no están siendo anatómicamente exactos, pero en aras de la 
licencia artística, y por el hecho de que crearon uno de los grandes poemas 
de la música rock, es difícil reprochárselo. 

La actividad musical implica casi todas las regiones del cerebro sobre 
las que tenemos conocimientos, y casi todo el subsistema neurológico. 
Diferentes regiones neurológicas manejan los diferentes aspectos de la 
música. El cerebro utiliza la segregación funcional para su procesamiento y 
emplea un sistema de detectores de rasgos cuya tarea consiste en analizar 
aspectos específicos de la señal musical, como el tono, el tempo, el timbre, 
etc. Parte del procesamiento de la música tiene puntos en común con las 
operaciones necesarias para analizar otros sonidos; la comprensión del 
lenguaje, por ejemplo, exige que segmentemos un chaparrón de sonidos en 
palabras, oraciones y frases, y que seamos capaces de entender aspectos que 
van más allá de las palabras, como el sarcasmo (¿no resulta eso 
interesante?). Para formarnos una representación coherente de lo que 
estamos escuchando deben analizarse varias dimensiones diferentes de un 
sonido musical (proceso en el cual suelen participar varios mecanismos 
neurológicos semiindependientes) que luego han de unirse. 

Escuchar música es un proceso que empieza con estructuras 
subcorticales (situadas por debajo del córtex): los núcleos cocleares, el 
tronco cerebral, el cerebelo. Luego asciende al córtex auditivo de ambos 
lados del cerebro. Intentar seguir música que conoces (o al menos música 
en un estilo con el que estés familiarizado, como la barroca o el blues) 
recluta regiones adicionales del cerebro, entre las que se incluyen el 
hipocampo (nuestro centro de la memoria) y subsecciones del lóbulo 
frontal, en especial una región llamada córtex frontal inferior, que está en 
las zonas más bajas del lóbulo frontal, es decir, más cerca de la barbilla que 
de la cúspide de la cabeza. Zapatear al compás de la música, físicamente o 
sólo con el pensamiento, exige la participación de circuitos 
cronometradores del cerebelo. Interpretar música (de forma independiente 
de qué instrumento toques, o si cantas O diriges) exige de nuevo la 


participación de los lóbulos frontales para la planificación de la conducta, 
así como del córtex motriz del lóbulo parietal justo debajo de la cúspide de 
la cabeza, y del córtex sensorial, que proporciona la retroalimentación táctil 
que te indica que has presionado la tecla correcta de tu instrumento o 
movido la batuta como pensaste que lo hacías. Leer música exige la 
participación del córtex visual, situado en la parte de atrás de la cabeza, en 
el lóbulo occipital. Escuchar o recordar letras invoca centros del lenguaje, 
que incluyen el área de Broca y la de Wernicke, así como otros centros del 
lenguaje de los lóbulos temporal y frontal. 

A un nivel más profundo, las emociones que experimentamos como 
reacción a la música afectan a estructuras profundas de las regiones reptiles 
primitivas del vermis cerebral y de la amígdala: el corazón del 
procesamiento emotivo en el córtex. La idea de especificidad regional es 
evidente en este resumen, pero se aplica también un principio 
complementario, el de distribución de la función. El cerebro es un 
instrumento enormemente paralelo, en el que las operaciones se distribuyen 
de manera amplia. No hay ningún centro único del lenguaje, ni hay 
tampoco un centro único de la música. Hay más bien regiones que realizan 
operaciones parciales y otras regiones que coordinan la agrupación de esa 
información. Por último, no hemos descubierto hasta hace muy poco que el 
cerebro tiene una capacidad de reorganización muy superior a la que antes 
le atribuíamos. Esta capacidad se denomina neuroplasticidad, y en algunos 
casos parece indicar que la especificidad regional puede ser temporal, pues 
los centros de procesamiento de funciones mentales importantes se 
desplazan en realidad a otras regiones después de un trauma o una lesión 
cerebral. 


Es difícil apreciar la complejidad del cerebro, porque los números son tan 
inmensos que sobrepasan con mucho nuestra experiencia cotidiana (a 
menos que seas un cosmólogo). El cerebro medio está formado por cien mil 
millones de neuronas. Supongamos que cada neurona es un dólar y 
estuvieses plantado en la esquina de una calle intentando entregar dólares a 
la gente que pasase con la máxima rapidez, digamos que al ritmo de un 
dólar por segundo. Si hicieses eso 24 horas al día, 365 días al año, sin parar, 


y si hubieses empezado el día en que nació Jesús, habrías distribuido hasta 
hoy sólo unos dos tercios de tu dinero. Incluso en el caso de que dieses 
billetes de cien dólares al ritmo de uno por segundo, tardarías treinta y dos 
años en entregarlos todos. Eso es un montón de neuronas, pero el poder real 
y la complejidad del cerebro (y del pensamiento) proceden de sus 
conexiones. 

Cada neurona está conectada a otras neuronas, normalmente a entre mil 
y diez mil más. Sólo cuatro neuronas pueden estar conectadas de 63 modos, 
o no estar conectadas en absoluto, de un total de 64 posibilidades. Al 
aumentar el número de neuronas, el número de conexiones posibles crece 
de forma exponencial (la fórmula de cómo n neuronas pueden estar 
conectadas entre sí es 20""01-/2)); 


Para 2 neuronas hay 2 posibilidades de cómo pueden estar conectadas 
Para 3 neuronas hay 8 posibilidades 

Para 4 neuronas hay 64 posibilidades 

Para 5 neuronas hay 1.024 posibilidades 

Para 6 neuronas hay 32.768 posibilidades 


El número de combinaciones se hace tan grande que es improbable que 
lleguemos a entender nunca todas las conexiones posibles que hay en el 
cerebro, o lo que significan. El número de combinaciones posibles (y por 
tanto el número de pensamientos diferentes posibles o estados cerebrales 
que cada uno de nosotros puede tener) es superior al número de partículas 
conocidas de todo el universo conocido. 

Asimismo, podemos ver que todas las canciones que hemos oído a lo 
largo de la vida (y todas las que se lleguen a crear) podrían estar 
compuestas de sólo doce notas musicales (ignorando las octavas). Cada 
nota puede conducir a otra nota, o a sí misma, o a un silencio, y eso plantea 
doce posibilidades. Pero cada una de esas posibilidades plantea doce más. 
Cuando incorporas ritmo (cada nota puede adoptar una cualquiera de 
muchas diferentes longitudes de nota) el número de posibilidades crece 
rápida, muy rápidamente. 


Gran parte de la capacidad de procesamiento del cerebro procede de 
esta enorme posibilidad de interconexión, y gran parte de ella deriva del 
hecho de que los cerebros son máquinas de procesamiento paralelo, en vez 
de procesamiento en serie. Un procesador en serie es como una línea de 
montaje, que maneja cada pieza de información cuando llega a la cinta de 
transmisión mental, efectuando alguna operación en ella y haciéndola 
continuar luego por la línea para la operación siguiente. Los ordenadores 
trabajan así. Pídele a un ordenador que descargue una canción de una 
página de la red, que te diga el tiempo que hace en tu ciudad, que guarde un 
archivo en el que has estado trabajando y hará las tres cosas una detrás de 
otra; las hace tan deprisa que puede dar la impresión de que las está 
haciendo al mismo tiempo (en paralelo) pero no es así. El cerebro, por su 
parte, puede trabajar en muchas cosas al mismo tiempo, superpuestas y en 
paralelo. Nuestro sistema auditivo procesa el sonido de modo que no tiene 
que esperar a saber cuál es el tono de un sonido para saber de dónde viene. 
Y los circuitos neurológicos dedicados a estas dos operaciones están 
intentando transmitir respuestas al mismo tiempo. Si un circuito 
neurológico termina su tarea antes que otro, envía simplemente su 
información a otras regiones cerebrales conectadas y ellas pueden empezar 
a utilizarlo. Si llega con retraso información que afecta a una interpretación 
de lo que estamos oyendo, procedente de un circuito de procesamiento 
separado, el cerebro puede «cambiar de idea» y poner al día lo que cree que 
pasa ahí fuera. Nuestros cerebros están actualizando constantemente sus 
opiniones centenares de veces por segundo (sobre todo las relacionadas con 
la percepción de estímulos visuales y auditivos), sin que nos demos cuenta 
siquiera. 

He aquí una analogía para explicar cómo se conectan entre sí las 
neuronas. Imagínate que estás sentado en casa solo un domingo por la 
mañana. No sientes nada en concreto, no te sientes particularmente feliz ni 
triste, ni enfadado, excitado, celoso o tenso. Te sientes más o menos neutro. 
Tienes un puñado de amigos, una red, y puedes llamar a cualquiera por 
teléfono. Digamos que cada uno de tus amigos es unidimensional y que 
pueden ejercer una gran influencia en tu estado de ánimo. Sabes, por 
ejemplo, que si telefoneas a tu amiga Hannah te hará sentirte alegre. 


Siempre que hablas con Sam te entristeces, porque los dos teníais un tercer 
amigo que murió y Sam te recuerda eso. Hablar con Carla te hace sentirte 
tranquilo y sereno, porque tiene una voz suave y te acuerdas de las veces 
que te sentaste en un bello claro del bosque con ella, empapándote de sol y 
meditando. Hablar con Edward te da energía; hablar con Tammy te hace 
sentirte tenso. Puedes descolgar el teléfono y conectarte con cualquiera de 
esos amigos y provocar una emoción determinada. 

Podrías tener cientos o miles de esos amigos unidimensionales, capaces 
cada uno de ellos de evocar un recuerdo concreto, o una experiencia o un 
estado de ánimo. Ésas son tus conexiones. Acceder a ellas provoca en ti un 
cambio de humor o de estado. Si hablases con Hannah y Sam al mismo 
tiempo, o uno después de otro, ella te alegraría, Sam te entristecería, y al 
final volverías a donde estabas, a un estado neutro. Pero podemos añadir un 
matiz adicional, que es el peso o poder de influencia de esas conexiones: lo 
próximo que te sientes a un individuo en un punto determinado del tiempo. 
Ese peso determina la influencia que tendrá sobre ti esa persona. Si te 
sientes el doble de próximo a Hannah de lo que te sientes a Sam, hablar con 
Hannah y con Sam una cantidad de tiempo igual te alegrará, aunque no 
tanto como si hubieses hablado sólo con Hannah: la tristeza de Sam te 
entristece, pero sólo te priva de la mitad de la alegría que te procuró hablar 
con Hannah. 

Consideremos que todas estas personas pueden hablar entre ellas, y que 
al hacerlo pueden modificarse sus estados de ánimo en un cierto grado. 
Aunque tu amiga Hannah tiene un carácter alegre, su alegría puede quedar 
atenuada por una conversación que tiene con Sam el triste. Si llamas por 
teléfono a Edward el estimulante inmediatamente después de hablar con 
Tammy el tenso (que acaba de hablar por teléfono con Justine la envidiosa), 
Edward puede hacerte sentir una nueva mezcla de emociones que no habías 
experimentado nunca, una especie de envidia tensa porque tienes un 
montón de energía para salir y hacer algo al respecto. Y cualquiera de esos 
amigos podría llamarte por teléfono en cualquier momento, evocando en ti 
esos estados como una compleja cadena de sentimientos o experiencias que 
hiciese el recorrido, influyendo cada uno en el otro, y tú, por tu parte, 
dejando en ellos tu huella emotiva. Con miles de amigos interconectados de 


este modo, y un puñado de teléfonos en el salón de tu casa sonando sin 
parar durante todo el día, el número de estados emotivos que podrías 
experimentar sería realmente muy variado. 

Se considera en general que nuestros pensamientos y recuerdos surgen 
de la miríada de conexiones de este tipo que establecen nuestras neuronas. 
No obstante, no todas las neuronas son igual de activas en un momento 
determinado. Eso provocaría una cacofonía de imágenes y sensaciones en 
nuestra cabeza (eso es lo que sucede en realidad en la epilepsia). Ciertos 
grupos de neuronas (podemos llamarlas redes) se activan durante ciertas 
actividades cognitivas, y pueden activar a su vez a otras neuronas. Cuando 
me doy un golpe en un dedo del pie, los receptores sensoriales del dedo 
envían señales al córtex sensorial del cerebro. Esto pone en marcha una 
Cadena de activaciones neuronales que me hacen experimentar dolor, retirar 
el pie del objeto contra el que me he dado el golpe y abrir la boca sin querer 
y gritar <¡8%(0!». 

Cuando oigo la bocina de un coche, moléculas de aire que inciden en mi 
tímpano hacen que se envíen señales eléctricas al córtex auditivo. Esto 
provoca una cascada de acontecimientos que recluta a un grupo muy 
distinto de neuronas de las del golpe del dedo del pie. Primero, neuronas del 
córtex auditivo procesan el tono del sonido para que yo pueda distinguir la 
bocina de un coche de algo con un tono diferente, como por ejemplo la 
bocina neumática de un camión o las de los partidos de fútbol. Para 
localizar la ubicación de la que llega el sonido se activa un grupo diferente 
de neuronas. Estos y otros procesos invocan una relación de orientación 
visual: me vuelvo hacia el sonido para ver qué lo produjo, e 
instantáneamente, si es necesario, retrocedo de un salto (el resultado de la 
actividad de las neuronas en el córtex motriz, orquestado con neuronas del 
centro emotivo, la amígdala, diciéndome que el peligro es inminente). 

Cuando oigo el Concierto de Piano número 3 de Rachmaninoff, las 
células capilares de mi cóclea clasifican el sonido que llega en bandas de 
frecuencia diferentes y envían señales eléctricas a mi córtex auditivo 
primario (área A1) que le indican qué frecuencias están presentes en la 
señal. Regiones adicionales del lóbulo temporal, incluidos el sulcus 
temporal superior y el gyrus temporal superior, situados a ambos lados del 


cerebro, ayudan a diferenciar los distintos timbres que estoy oyendo. Si 
quiero etiquetar esos timbres, el hipocampo ayuda a recuperar el recuerdo 
de sonidos similares que he oído antes, y luego necesitaré acceder a mi 
diccionario mental, lo que exigirá la utilización de estructuras que se hallan 
en la confluencia de los lóbulos temporal, occipital y parietal. Hasta ahora, 
estas regiones son las mismas, aunque activadas de formas diferentes y con 
poblaciones de neuronas diferentes, de las que utilizaría para procesar el 
sonido de la bocina del coche. Sin embargo, se activarán nuevas 
poblaciones completas de neuronas cuando atienda a las secuencias tonales 
(córtex prefrontal dorsolateral y áreas 44 y 47 de Brodmanmn), los ritmos (el 
cerebelo lateral y el vermis cerebelar) y a la emoción (los lóbulos frontales, 
el cerebelo, la amígdala y el núcleo accumbens, parte de una red de 
estructuras implicadas en los sentimientos de placer y recompensa, ya sea a 
través de la comida, las relaciones sexuales o la audición de música 
placentera). 

En cierta medida, si la habitación está vibrando con los sonidos 
profundos del contrabajo, algunas de esas mismas neuronas que se 
activaron cuando me di un golpe en el dedo del pie pueden activarse ahora: 
neuronas sensibles al aporte sónico. Si la bocina del coche tiene un tono de 
A440, se activarán las neuronas con esa frecuencia; lo más probable es que 
lo hagan y que vuelvan a hacerlo cuando se produzca un A440 en 
Rachmaninoff. Pero es probable que mi experiencia mental interior sea 
distinta debido a los diferentes contextos implicados y a las redes 
neuronales distintas que se reclutan en los dos casos. 

Mi experiencia con oboes y violines es diferente, y la forma particular 
con que hace uso de ellos Rachmaninoff puede provocar en mí una reacción 
a su concierto opuesta a la provocada por la bocina del coche; en vez de 
sentirme sobresaltado, me siento relajado. Las partes tranquilas del 
concierto podrían activar las mismas neuronas que se activan cuando me 
siento tranquilo y seguro en mi entorno. 

He aprendido por la experiencia a asociar las bocinas de coches con el 
peligro, O al menos con alguien que intenta llamar mi atención. ¿Cómo 
sucedió esto? Algunos sonidos son intrínsecamente calmantes mientras que 
otros asustan. Aunque hay mucha variación interpersonal, nacemos con una 


predisposición a interpretar sonidos de una forma concreta. Los sonidos 
fuertes, breves y bruscos tienden a ser interpretados por los animales como 
sonidos de alerta; vemos esto cuando comparamos las llamadas de alerta de 
aves, roedores y monos. Los sonidos de comienzo lento, largos y más 
sosegados tienden a interpretarse como tranquilizadores o por lo menos 
neutrales. Piensa en el sonido agudo del ladrido de un perro, frente al 
ronroneo suave de un gato que está pacíficamente sentado en tu regazo. Los 
compositores saben esto, claro, y utilizan cientos de matices sutiles de 
timbre y longitud de nota para transmitir los muchos matices emotivos 
distintos de la experiencia humana. 

En la «Sinfonía Sorpresa» de Haydn (Sinfonía 94 en Sol Mayor, 
segundo movimiento, andante), el compositor crea el suspense utilizando 
violines suaves en el tema principal. La suavidad del sonido es acariciadora, 
pero la brevedad del acompañamiento de pizzicato envía un mensaje leve y 
contradictorio de peligro y juntos dan una ligera sensación de suspense. La 
idea melódica principal abarca poco más de media octava, una quinta 
perfecta. El contorno melódico sugiere más complacencia..., la melodía 
sube primero, luego baja, luego repite el motivo de «subida». El 
paralelismo que implica la melodía, la subida/bajada/subida, prepara al 
oyente para otra parte de «bajada». El maestro, continuando con las notas 
breves y suaves de violín, cambia la melodía subiendo (sólo un poco) pero 
mantiene constantes los ritmos. Descansa en la quinta, un tono de relativa 
estabilidad armónica. Como la quinta es la nota más alta que hemos 
encontrado hasta ahora, esperamos que cuando llegue la nota siguiente sea 
más baja, que empiece con la vuelta hacia la raíz (la tónica) y «cierre el 
vacío» creado por la distancia entre la tónica y la nota presente, la quinta. 
Luego Haydn nos envía de la nada una nota fuerte una octava más alta, con 
los timbales y los cuernos metálicos llevando el sonido. Ha violado nuestras 
expectativas respecto a la dirección melódica, el contorno, el timbre y la 
intensidad, todo al mismo tiempo. Esa es la «Sorpresa» de la «Sinfonía 
Sorpresa». 

Esta sinfonía de Haydn viola nuestras expectativas de cómo funciona el 
mundo. Hasta a alguien sin ningún conocimiento musical ni expectativas 
musicales de ningún tipo le resulta sorprendente la sinfonía debido a ese 


efecto tímbrico, con ese cambio del ronroneo suave de los violines a la 
llamada de alerta de cuernos y timbales. Para alguien con una formación 
musical, la sinfonía viola expectativas que han ido creándose sobre la base 
del estilo y la convención musical. ¿En qué zona del cerebro se producen 
sorpresas, expectativas y análisis de este tipo? Aún no se ha aclarado del 
todo cómo se realizan exactamente estas operaciones en las neuronas, pero 
tenemos algunas claves. 


Antes de seguir, tengo que confesar que no soy imparcial en mi forma de 
enfocar el estudio científico de mente y cerebro: tengo una preferencia clara 
por el estudio de la mente frente al del cerebro. Parte de esa preferencia es 
personal más que profesional. De niño no coleccionaba mariposas con el 
resto de mi clase de ciencias porque la vida (toda vida) me parece sagrada. 
Y la dura realidad sobre la investigación cerebral a lo largo del último siglo 
es que entraña generalmente hurgar en los cerebros de animales vivos, a 
menudo nuestros primos genéticos próximos, monos y simios, y luego 
matar (ellos lo llaman «sacrificar») al animal. Trabajé durante un 
desdichado semestre en un laboratorio de monos, diseccionando cerebros de 
animales muertos para prepararlos para el examen microscópico. Tenía que 
pasar todos los días al lado de las jaulas de los que aún estaban vivos. Tenía 
pesadillas. 

Por otro lado, me han fascinado siempre más los pensamientos en sí que 
las neuronas en las que se originan. Una teoría de la ciencia cognitiva 
llamada funcionalismo (que apoyan muchos investigadores sobresalientes) 
afirma que pueden surgir de cerebros completamente distintos mentes 
similares, que los cerebros son sólo la colección de cables y módulos de 
procesamiento que instan al pensamiento. La doctrina funcionalista, sea 
cierta O no, indica que lo que podemos saber sobre el pensamiento 
estudiando sólo cerebros tiene sus límites. Un neurocirujano le explicó una 
vez a Daniel Dennett (destacado y persuasivo portavoz del funcionalismo) 
que había operado a cientos de personas y había visto cientos de cerebros 
vivos y pensantes, pero nunca había visto un pensamiento. 

Cuando yo estaba intentando decidir a qué escuela graduada 
incorporarme, y a quién quería tener como mentor, me enamoré de la obra 


del profesor Michael Posner. Había sido el introductor de una serie de 
formas de enfocar los procesos mentales, entre ellas la cronometría mental 
(la idea de que se puede aprender mucho sobre la organización de la mente 
determinando cuánto tarda en pensar determinados pensamientos), de 
formas de investigar la estructura de categorías y del famoso paradigma de 
Posner, un novedoso método para estudiar la atención. Pero corrían rumores 
de que Posner estaba abandonando la mente y había empezado a estudiar el 
cerebro, algo que desde luego yo no quería hacer. 

Aunque era aún un estudiante de grado (pese a ser algo más viejo de lo 
normal), asistí a la reunión anual de la Asociación Psicológica Americana, 
que se celebró en San Francisco ese año, a sólo unos setenta kilómetros de 
Stanford, donde yo estaba terminando la carrera. Vi el nombre de Posner en 
el programa y asistí a su charla, donde expuso numerosas diapositivas de 
cerebros de individuos mientras estaban haciendo una cosa y otra. Una vez 
terminada la charla Posner respondió a unas cuantas preguntas y luego 
desapareció por una puerta trasera. Yo corrí a la parte de atrás y vi que 
caminaba a toda prisa cruzando el centro de conferencias para dar otra 
charla. Me lancé tras él y lo alcancé. ¡Debí de parecerle todo un 
espectáculo! Estaba sin aliento por la carrera. Incluso sin el jadeo, estaba 
nervioso por el acontecimiento de poder hablar con una de las grandes 
leyendas de la psicología cognitiva. Había leído su manual en mi primera 
clase de psicología en el MIT (donde inicié mis estudios antes de 
trasladarme a Stanford); mi primera profesora de psicología, Susan Carey, 
hablaba de él con un tono de voz que sólo podía describirse como 
reverencial. Aún puedo recordar el eco de sus palabras, reverberando en el 
salón de conferencias del MI'T: «Michael Posner, una de las personas más 
inteligentes y más innovadoras que he conocido en mi vida». 

Empecé a sudar, abrí la boca, y... nada. «Mmmm...», balbucí. Íbamos 
caminando entre tanto uno al lado del otro a toda prisa (él camina rápido) y 
cada dos o tres pasos yo me quedaba de nuevo atrás. “Tartamudeé una 
presentación y dije que había solicitado el ingreso en la Universidad de 
Oregón para trabajar con él. Yo nunca había tartamudeando antes, pero 
tampoco había estado nunca tan nervioso. «P-p-p-profesor P-p-posner, he 
oído que ha pasado usted a centrar su investigación completamente en el ce- 


ce-cerebro..., ¿es verdad? Porque yo quiero realmente estudiar psicología 
cognitiva con usted», le expliqué por fin. 

«Bueno, estoy un poco interesado en el cerebro últimamente —dijo—. 
Pero para mí la neurociencia cognitiva es un medio de establecer los límites 
de nuestras teorías de psicología cognitiva. Nos ayuda a comprobar si un 
modelo tiene una base plausible en la anatomía subyacente.» 

Mucha gente llega a la neurociencia con una formación en biología o 
química, y lo que más les interesa son los mecanismos por los que las 
células se comunican entre sí. Para el neurocientífico cognitivo, comprender 
la anatomía o la fisiología del cerebro puede ser un reto como ejercicio 
intelectual (el equivalente para los científicos del cerebro de un crucigrama 
realmente complicado), pero no es el objetivo final de su trabajo. Nuestro 
objetivo es entender los procesos mentales, los recuerdos, las emociones y 
las experiencias, y el cerebro da simplemente la casualidad de que es la caja 
en la que sucede todo eso. Volviendo a la analogía del teléfono y las 
conversaciones que podrías tener con diferentes amigos que influyesen en 
tus emociones: si quiero predecir cómo te vas a sentir mañana, tendrá para 
mí sólo un valor limitado cartografiar la distribución de las líneas 
telefónicas que conectan a todas las personas que conoces. Es más 
importante conocer sus tendencias individuales: ¿quiénes es probable que te 
llamen mañana y qué es lo que probablemente te dirán? ¿Cómo pueden 
hacerte sentir? Sería también un error, claro, pasar por alto del todo el tema 
de la conectividad. Si se rompe una línea, o si no hay prueba alguna de una 
conexión entre la persona A y la persona B, o si la persona C no puede 
llamar directamente pero puede influir en ti a través de A que sí puede 
llamarte directamente..., toda esa información facilita precisiones 
importantes para una predicción. 

Esa perspectiva influye en mi forma de estudiar la neurociencia 
cognitiva de la música. No me interesa embarcarme en una expedición de 
pesca consistente en probar todos los estímulos musicales posibles para 
descubrir en qué parte del cerebro se producen; Posner y yo hemos hablado 
muchas veces sobre el loco y apresurado afán actual de cartografiar el 
cerebro, similar a tanta otra cartografía ateórica. Lo que yo pretendo no es 
elaborar un mapa del cerebro, sino entender cómo funciona, cómo las 


diferentes regiones coordinan juntas su actividad, cómo la simple activación 
de neuronas y la circulación de neurotransmisores conduce a pensamientos, 
risa, sentimientos de profunda alegría y tristeza, y cómo todas esas cosas 
pueden llevarnos, a su vez, a crear obras de arte perdurables y 
significativas. Ésas son las funciones de la mente, y saber dónde se 
producen no me interesa a menos que el dónde pueda decirnos algo sobre el 
cómo y el porqué. Un supuesto de la neurociencia cognitiva es que puede. 

Mi perspectiva es que, del infinito número de experimentos posibles, los 
que merecen la pena son aquellos que pueden conducirnos a un mejor 
entendimiento del cómo y el porqué. Un buen experimento tiene que tener 
una motivación teórica, y aclarar predicciones respecto a cuál de dos o más 
hipótesis opuestas se verá respaldada. No merece la pena hacer un 
experimento que sea probable que respalde dos hipótesis contrapuestas; la 
ciencia sólo puede avanzar a través de la eliminación de hipótesis falsas o 
insostenibles. 

Otra cualidad de un buen experimento es que pueda generalizarse en 
otras condiciones: gente sin formación musical, tipos de música no 
estudiados y una variedad de situaciones. Mucha de la investigación 
conductual se realiza sólo con un pequeño número de individuos («sujetos» 
del experimento), y con estímulos muy artificiales. En mi laboratorio 
utilizamos músicos y también personas que no son músicos siempre que es 
posible, con el fin de aprender sobre el rango más amplio posible de 
individuos. Y casi siempre utilizamos música del mundo real, grabaciones 
concretas de músicos reales tocando canciones reales, de modo que 
podamos entender mejor las reacciones del cerebro ante el tipo de música 
que escucha la mayoría de la gente, en vez del tipo de música que sólo se 
encuentra en el laboratorio neurocientífico. Hasta ahora este enfoque ha 
resultado eficaz. Es más difícil aportar controles experimentales rigurosos 
con él, pero no es imposible; exige un poco más de planificación y de 
preparación cuidadosa, pero los resultados hacen que merezca la pena a la 
larga. Utilizando este enfoque naturalista, yo puedo afirmar con una certeza 
científica razonable que estamos estudiando el cerebro haciendo lo que 
normalmente hace, en vez de lo que hace cuando le asaltan ritmos sin 
ningún tono o melodías sin ningún ritmo. Al intentar descomponer la 


música en sus componentes, corremos el riesgo (si no se hacen de forma 
adecuada los experimentos) de crear secuencias sonoras que son muy 
antimusicales. 

Cuando digo que estoy menos interesado en el cerebro que en la mente, 
no quiero decir que no me interese nada el cerebro. ¡Creo que todos 
tenemos cerebro y creo que los cerebros son importantes! Pero también creo 
que pueden surgir pensamientos similares de arquitecturas cerebrales 
distintas. Puedo ver, estableciendo una analogía, el mismo programa de 
televisión en un RCA, un Zenith, un Mitsubishi, y hasta en la pantalla de mi 
ordenador con el software y el hardware adecuados. Las arquitecturas de 
todos estos aparatos son lo bastante distintas entre sí como para que la 
oficina de patentes (una organización que tiene la responsabilidad de decidir 
cuándo algo es lo suficientemente distinto de otra cosa como para que 
constituya un invento) haya emitido patentes distintas para estas diferentes 
empresas, declarando que las arquitecturas subyacentes son 
significativamente distintas. Mi perro Shadow tiene una organización 
cerebral, una anatomía y una composición neuroquímica muy diferente de 
la mía. Cuando tiene hambre o le duele una pata, es improbable que la pauta 
de activaciones nerviosas de su cerebro tenga mucha similitud con la pauta 
de activaciones del mío cuando tengo hambre o cuando me hago daño en un 
pie. Pero creo que experimenta estados de ánimo en esencia similares. 

Hay que dejar a un lado ciertas concepciones erróneas e ilusiones 
frecuentes. Hay mucha gente, incluso científicos con formación y 
experiencia en otras disciplinas, que está convencida de que dentro del 
cerebro hay una representación rigurosamente isomórfica del mundo que 
nos rodea. («Isomórfica» viene de la palabra griega iso, que significa 
«igual», y morfus, que significa «forma».) Los psicólogos de la Gestalt, que 
tenían razón en muchas cosas, fueron unos de los primeros que formularon 
esta idea. Si miras un cuadrado, afirmaban, se activa en tu cerebro una 
pauta de forma cuadrada de neuronas. Muchos estamos convencidos de que 
si estamos mirando un árbol, la imagen del árbol se representa de algún 
modo en el cerebro como un árbol, y que tal vez ver el árbol activa un 
conjunto de neuronas en forma de árbol, con raíces en un extremo y hojas 
en el otro. Cuando escuchamos o imaginamos una de nuestras canciones 


favoritas, parece como si la estuviésemos oyendo dentro de la cabeza, a 
través de un equipo de altavoces neurológicos. 

Daniel Dennett y V. S. Ramachandran han expuesto con elocuencia lo 
problemática que es esta intuición. Si una imagen mental de algo (en el 
momento en que la vemos o cuando la imaginamos en la memoria) es en sí 
misma una imagen, tiene que haber alguna parte de nuestra mente/cerebro 
que vea esa imagen. Dennett habla sobre la intuición de que se forman 
escenas visuales en algún tipo de pantalla o teatro de nuestra mente. Para 
que esto sea cierto, tendrá que haber alguien en el patio de butacas de ese 
teatro mirando la pantalla, y manteniendo una imagen mental dentro de su 
cabeza. ¿Y quién sería ése? ¿Cómo sería esa imagen mental? Esto nos 
conduce rápidamente a una regresión infinita. Es aplicable el mismo 
argumento a los fenómenos auditivos. Nadie dice que no se tenga la 
sensación de que hay dentro de nuestra mente un sistema de audio. El hecho 
de que podamos manipular imágenes mentales (podemos acercarnos 
rápidamente a ellas, girarlas, en el caso de la música podemos acelerar o 
aminorar la canción dentro de la cabeza) nos induce a pensar que hay un 
teatro doméstico en la mente. Pero como es lógico, eso no puede ser verdad 
debido al problema de la regresión ad infinitum. 

Somos también víctimas de la ilusión de que abrimos simplemente los 
ojos y... vemos. Un pájaro gorjea fuera al otro lado de la ventana y de 
forma instantánea lo oímos. La percepción sensorial crea imágenes en 
nuestra mente (representaciones del mundo exterior) tan deprisa y tan de 
una pieza que parece que no hay nada más en el asunto. Se trata de una 
ilusión. Nuestras percepciones son el producto final de una larga cadena de 
fenómenos neuronales que nos dan la falsa impresión de una imagen 
instantánea. Hay campos en los que nuestras intuiciones más fuertes nos 
engañan. La Tierra plana es un ejemplo. La intuición de que nuestros 
sentidos nos dan una visión no distorsionada del mundo es otra. 

Se sabe como mínimo desde la época de Aristóteles que nuestros 
sentidos pueden deformar el modo que tenemos de percibir el mundo. Mi 
profesor Roger Shepard, un psicólogo de la percepción de la Universidad de 
Stanford, solía decir que hemos de dar por supuesto que nuestro sistema 
perceptivo, cuando funciona adecuadamente, distorsiona el mundo que 


vemos y oímos. Interactuamos con el mundo que nos rodea a través de los 
sentidos. Como indicó John Locke, todo lo que sabemos sobre el mundo es 
a través de lo que vemos, oímos, olemos, tocamos o gustamos. Suponemos 
como es natural que el mundo es justo como percibimos que es. Pero los 
experimentos nos han obligado a afrontar la realidad de que no es así. Las 
ilusiones visuales tal vez sean la prueba más convincente de la distorsión 
sensorial. Muchos hemos visto ilusiones de ese tipo de niños, como cuando 
dos líneas de la misma longitud parecen tener longitudes distintas (la ilusión 
de Ponzo). 


Roger Shepard dibujó una ilusión visual que él llama «Girar las Mesas» que 
tiene relación con la de Ponzo. Es difícil de creer, pero los tableros de esas 
mesas son idénticos en tamaño y en forma (puedes comprobarlo cortando 
un trozo de papel o de celofán del tamaño exacto de uno y colocándolo 
luego sobre el otro). Esta ilusión explota un principio de los mecanismos de 
percepción de la profundidad de nuestro sistema visual. Ni siquiera saber 
que es una ilusión nos permite desconectar el mecanismo. Por muchas 
veces que miremos esta figura, sigue sorprendiéndonos, porque nuestro 
cerebro nos está dando en realidad una información falsa sobre los objetos. 


En la ilusión de Kaniza parece que hay un triángulo blanco colocado 
encima de uno de contorno negro. Pero si miras detenidamente, verás que 
no hay en la figura ningún triángulo. Nuestro sistema perceptivo completa o 
«llena» información que no hay. 
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¿Por qué lo hace? Lo que nos parece más probable es que fue 
evolutivamente adaptativo hacerlo así. En gran parte de lo que vemos y 
oímos falta información. Nuestros ancestros cazadores-recolectores podrían 
haber visto un tigre parcialmente oculto por los árboles, u oído el rugido de 
un león amortiguado en parte por el susurro de las hojas mucho más cerca 
de nosotros. Sonidos e imágenes nos llegan a menudo como información 
parcial oscurecida por otras cosas del entorno. Un sistema perceptivo capaz 
de restaurar información que falta nos ayudaría a tomar decisiones rápidas 
en situaciones peligrosas. Mejor echar a correr en ese instante que esperar 


para intentar determinar si esos dos fragmentos independientes y bruscos de 
sonido son parte de un solo rugido de león. 

El sistema auditivo tiene su propia versión de ese mecanismo perceptivo 
de completar. El psicólogo cognitivo Richard Warren lo demostró 
particularmente bien. Grabó una frase: «El proyecto de ley se aprobó en 
ambas cámaras legislativas», y cortó un trozo de la frase de la cinta. 
Sustituyó la parte cortada por una ráfaga de ruidos parásitos de la misma 
duración. Casi todos los que oyeron la grabación alterada pudieron informar 
de que habían oído la frase y además los ruidos parásitos. ¡Pero una gran 
proporción de ellos no pudieron decir dónde estaban los parásitos! El 
sistema auditivo había rellenado la información oral que faltaba, de modo 
que la frase parecía no estar interrumpida. La mayoría informaron de que 
había parásitos y que estaban separados de la frase hablada. Los parásitos y 
la frase formaron corrientes perceptivas separadas debido a diferencias de 
timbre que hicieron que se los agrupara por separado; Bregman llama a esto 
canalización por el timbre. Es evidente que se trata de una distorsión 
sensorial; nuestro sistema perceptivo nos está diciendo algo sobre el mundo 
que no es verdad. Pero está igual de claro que esto tiene un valor 
evolutivo/adaptativo si puede ayudarnos a dar sentido al mundo durante una 
situación de vida o muerte. 

De acuerdo con los grandes psicólogos de la percepción Hermann von 
Helmholtz, Richard Gregory, Irvin Rock y Roger Shepard, la percepción es 
un proceso de inferencia y entraña un análisis de probabilidades. La tarea 
del cerebro es determinar cuál es la disposición más probable de los objetos 
en el mundo físico, de acuerdo con una pauta dada de información que llega 
a los receptores sensoriales, la retina para visión, el tímpano para la 
audición. La mayor parte del tiempo la información que recibimos en 
nuestros receptores sensoriales es incompleta o ambigua. Las voces están 
mezcladas con otras voces, los sonidos de máquinas, del viento, de pisadas. 
Estés donde estés en este momento (ya sea en un avión, en un café, en una 
biblioteca, en casa, en un parque o en cualquier otro lugar) detente y 
escucha los sonidos del entorno. A menos que estés en un tanque de 
aislamiento sensorial, probablemente puedas identificar media docena de 
sonidos diferentes por lo menos. La capacidad de tu cerebro para realizar 


esas identificaciones es sin duda alguna notable si consideramos con qué 
empieza, es decir, qué es lo que le transmiten los receptores sensoriales. Los 
principios de agrupación (por timbre, ubicación espacial, intensidad y 
demás) ayudan a segregarlos, pero aun así hay un montón de cosas que no 
sabemos de ese proceso; nadie ha conseguido aún diseñar una computadora 
que pueda realizar esa tarea de separación de la fuente sonora. 

El tímpano es sólo una membrana estirada sobre tejido y hueso. Es la 
puerta de la audición. Prácticamente todas tus impresiones del mundo 
auditivo proceden de su modo de serpentear hacia atrás y hacia delante en 
respuesta a las moléculas de aire que impactan en él (el pabellón auricular, 
las partes carnosas de la oreja, participan también en cierto grado en la 
percepción auditiva, así como los huesos del cráneo, pero es ante todo el 
tímpano la fuente principal de lo que sabemos sobre lo que hay ahí fuera en 
el mundo auditivo). Consideremos una escena auditiva típica, una persona 
sentada en el cuarto de estar de su casa leyendo un libro. Supongamos que 
hay seis fuentes de sonido en ese entorno que esa persona puede identificar 
fácilmente: el ruido constante de la calefacción central (el ventilador o 
Calefactor que mueve aire a través del conducto), el murmullo de un 
refrigerador en la cocina, tráfico fuera en la calle (que podría estar 
compuesto de varios sonidos distintos o docenas de sonidos de diferentes 
motores, frenos rechinando, bocinas, etc.), el susurro de las hojas movidas 
por el viento fuera, un gato que ronronea en la silla a su lado y una 
grabación de preludios de Debussy. Cada una de esas cosas puede 
considerarse un objeto auditivo o una fuente sonora, y somos capaces de 
identificarlos porque cada uno de ellos tiene su propio sonido distintivo. 

El sonido lo transmiten a través del aire moléculas que vibran a 
determinadas frecuencias. Estas moléculas bombardean el tímpano, 
haciendo que culebree hacia dentro y hacia fuera según la intensidad con 
que impactan en él (algo relacionado con el volumen o amplitud del sonido) 
y con lo rápido que vibran (relacionado con lo que llamamos altura de 
tono). Pero no hay nada en las moléculas que le diga al tímpano de dónde 
proceden, o cuáles están asociadas con qué objeto. Las moléculas puestas 
en movimiento por el ronroneo del gato no llevan una etiqueta 
identificadora que dice «gato», y pueden llegar al tímpano al mismo tiempo 


y en la misma región que los sonidos de la nevera, el calentador, Debussy y 
todo lo demás. 

Imagina que extiendes la funda de un almohadón sobre la boca de un 
cubo y que varias personas lanzan a él pelotas de pimpón desde distancias 
diferentes. Cada persona puede tirar tantas pelotas de pimpón como quiera 
y con la frecuencia que quiera. Tu tarea es determinar, sólo mirando cómo 
se mueve hacia arriba y hacia abajo la funda, cuántas personas hay, quiénes 
son y si están acercándose a ti, alejándose de ti o quietas. Esto es algo 
semejante a lo que tiene que afrontar el sistema auditivo para hacer 
identificaciones de objetos auditivos en el mundo utilizando sólo el 
movimiento del tímpano como guía. ¿Cómo determina el cerebro, a partir 
de esta mezcla desorganizada de moléculas que impactan en una membrana, 
qué hay en el exterior? Y en especial, ¿cómo hace eso con la música? 

Lo hace a través de un proceso de extracción de rasgos, seguido de otro 
proceso de integración de rasgos. El cerebro extrae rasgos básicos de bajo 
nivel de la música, utilizando redes neuronales especializadas que 
descomponen la señal en información sobre altura de tono, timbre, 
ubicación espacial, intensidad, entorno reverberante, duraciones tonales y 
los tiempos de comienzo de las diferentes notas (y de los diferentes 
componentes de tonalidades). Estas operaciones se efectúan en paralelo y 
las efectúan circuitos neuronales que computan esos valores y que pueden 
operar en cierto modo de forma independiente unos de otros, es decir, el 
circuito de altura de tono no tiene que esperar para efectuar sus cálculos a 
que haya terminado el de duración. Este tipo de procesamiento (en que los 
circuitos neuronales sólo consideran la información contenida en el 
estímulo) se llama procesamiento de abajo arriba. En el mundo y en el 
cerebro esos atributos de la música son separables. Podemos cambiar uno 
sin cambiar el otro, de igual modo que podemos cambiar la forma de 
objetos visuales sin cambiar su color. 

El procesamiento de arriba abajo de bajo nivel de elementos básicos se 
produce en las partes periféricas y filogenéticamente más antiguas del 
cerebro; el término «bajo nivel» alude a la percepción de atributos 
elementales o bloques formativos de un estímulo sensorial. El 
procesamiento a alto nivel se produce en partes más refinadas del cerebro 


que toman proyecciones neuronales de los receptores sensoriales y de una 
serie de unidades de procesamiento de bajo nivel; esto hace referencia a la 
combinación de elementos de bajo nivel en una representación integrada. El 
procesamiento de alto nivel es donde se junta todo, donde nuestras mentes 
llegan a una interpretación de forma y contenido. El procesamiento de bajo 
nivel de nuestro cerebro ve en esta página manchas de tinta, y puede que 
incluso te permita unir esas manchas y reconocer una forma básica en tu 
vocabulario visual, como por ejemplo la letra A. Pero es el procesamiento 
de alto nivel el que junta cuatro letras para permitirte leer la palabra ARTE 
y generar una imagen mental de lo que la palabra significa. 

Al mismo tiempo que se está produciendo la extracción de rasgos en la 
cóclea, el córtex auditivo, el tallo cerebral y el cerebelo, los centros de más 
alto nivel de nuestro cerebro, están recibiendo un flujo constante de 
información sobre lo extraído hasta el momento; esta información se 
actualiza continuamente y lo habitual es que se reescriba la información 
más antigua. Mientras reciben estas actualizaciones, los centros de 
pensamiento superior (sobre todo en el córtex frontal) trabajan de forma 
denodada para predecir lo que vendrá a continuación en la música, 
basándose en varios factores: 


— lo que ha llegado ya antes de la pieza de música que estamos 
oyendo; 

— lo que recordamos que vendrá a continuación si estamos 
familiarizados con esa Música; 

— lo que esperamos que venga a continuación si el género o estilo nos 
es familiar, debido a la exposición previa a ese tipo de música; 

— cualquier información adicional que hayamos recibido, como un 
resumen de la música que hayamos leído, un movimiento súbito de 
un intérprete o un codazo de la persona que está sentada a nuestro 
lado. 


Estos cálculos del lóbulo frontal se denominan procesamiento de arriba 
abajo, y pueden influir en los módulos de bajo nivel mientras están 
realizando sus cálculos de abajo arriba. Las expectativas de arriba abajo 


pueden hacer que percibamos erróneamente cosas reordenando parte del 
circuito en los procesadores de abajo arriba. Esta es en parte la base 
neuronal del relleno perceptual y de otras ilusiones. 

Los procesos de arriba abajo y de abajo arriba se informan mutuamente 
sobre la marcha. Al mismo tiempo que se están analizando rasgos 
individuales, partes del cerebro que están más arriba (es decir, que son más 
avanzadas filogenéticamente, y que reciben conexiones de regiones 
cerebrales más bajas) están trabajando para integrar esos rasgos en un todo 
perceptivo. El cerebro construye una representación de la realidad, basada 
en esos rasgos componentes, de una forma muy parecida a cómo un niño 
construye un fuerte con los bloques del Lego. El cerebro efectúa en el 
proceso una serie de deduciones, debido a que recibe una información 
incompleta o ambigua; a veces esas deduciones resultan erróneas, y eso es 
lo que son las ilusiones visuales y auditivas: demostraciones de que nuestro 
sistema perceptivo ha incurrido en una suposición incorrecta sobre lo que 
hay en el exterior. 

El cerebro afronta tres problemas cuando intenta identificar los objetos 
auditivos que oímos. Primero, la información que llega a los receptores 
sensoriales es indiferenciada. Segundo, es una información ambigua: 
objetos distintos pueden dar origen a pautas de activación en el tímpano 
similares o idénticas. Tercero, raras veces es una información completa. 
Partes del sonido pueden estar cubiertas por otros sonidos, o perderse. El 
cerebro tiene que hacer un cálculo conjetural de qué es lo que hay en 
realidad en el exterior. Lo hace muy de prisa y en general de una forma 
subconsciente. Las ilusiones que vimos antes, junto con estas operaciones 
perceptivas, no están sometidas a nuestra conciencia. Por ejemplo, la razón 
de que veas triángulos donde no hay ninguno en la figura de Kaniza se debe 
a ese proceso de finalización. Pero incluso después de conocer los 
principios que están involucrados, es imposible desconectarlos. Tu cerebro 
sigue procesando la información del mismo modo y tú sigues 
sorprendiéndote por el resultado. 

Helmholtz llamó a este proceso «inferencia inconsciente». Rock le 
llamó «la lógica de la percepción». George Miller, Ulrich Neisser, Herbert 
Simon y Roger Shepard han descrito la percepción como un «proceso 


constructivo». Son todos medios de decir que lo que vemos y oímos es el 
final de una larga cadena de acontecimientos mentales que dan origen a una 
impresión, una imagen mental, del mundo físico. Muchas de las formas de 
funcionamiento del cerebro (incluidos nuestros sentidos del color, el gusto, 
el olfato y la audición) surgieron debido a presiones evolutivas, algunas de 
las cuales no existen ya. El psicólogo cognitivo Steven Pinker y otros han 
sugerido que nuestro sistema de percepción de la música era básicamente 
un accidente evolutivo, y que presiones de supervivencia y de selección 
sexual crearon un lenguaje y un sistema de comunicación que aprendimos a 
explotar con fines musicales. Se trata de un tema polémico en la comunidad 
de la psicología cognitiva. El registro arqueológico nos ha dejado algunas 
claves, pero raras veces nos deja una «pistola humeante» que permita que 
queden definitivamente aclaradas las cosas. El fenómeno de la finalización 
que he descrito no es sólo una curiosidad de laboratorio; los compositores 
explotan también este principio, sabiendo que nuestra percepción de una 
línea melódica continuará, aunque parte de ella esté obscurecida por otros 
instrumentos. Siempre que oímos las notas más bajas en el piano o en el 
contrabajo, no estamos en realidad oyendo 27,5 o 35 hercios, porque esos 
instrumentos son por naturaleza incapaces de producir mucha energía a esas 
frecuencias ultrabajas: nuestros oídos están finalizando la información y 
creándonos la ilusión de que la tonalidad es así de baja. 

Experimentamos ilusiones en la música de otros modos. En obras de 
piano como «El murmullo de la primavera» de Sindig o en la Fantasía- 
Impromptu en do sostenido menor, op. 66, de Chopin, las notas van tan 
rápidas que emerge una melodía ilusoria. Si se interpreta la pieza 
lentamente desaparece. Debido a la segregación de corrientes, la melodía 
«brota» cuando las notas están lo bastante próximas en el tiempo (el sistema 
perceptivo mantiene las notas juntas) pero la melodía se pierde cuando sus 
notas están demasiado separadas en el tiempo. Tal como estudió Bernard 
Lortat-Jacob en el Musée de 1'Homme de París, la quintina (literalmente 
«pequeña quinta») de Cerdeña, una música vocal a capella, también 
transmite una ilusión: de las cuatro voces masculinas aflora una quinta voz 
femenina cuando la armonía y los timbres se ejecutan en la forma correcta. 


(Ellos creen que la voz es la de la Virgen María que acude a recompensarlos 
si son lo suficientemente piadosos para cantarla bien.) 

En «One of These Nights» de los Eagles (la canción que da título al 
álbum del mismo nombre) la canción se inicia con una pauta interpretada 
por bajo y guitarra que suena como un instrumento: el bajo da una sola nota 
y la guitarra añade un glissando, pero el efecto perceptivo es del bajo 
deslizándose, debido al principio gestáltico de buena continuación. George 
Shearing creó un nuevo efecto tímbrico haciendo que la guitarra (o en 
algunos casos el vibráfono) duplicase con tanta exactitud lo que estaba 
tocando al piano que los oyentes se iban preguntándose: «¿Qué nuevo 
instrumento es ése?», cuando se trataba en realidad de dos instrumentos 
separados cuyos sonidos se habían fundido perceptualmente. En «Lady 
Madonna», los cuatro Beatles cantan en sus manos ahuecadas durante un 
corte instrumental y nosotros juramos que hay saxofones tocando, debido al 
timbre insólito que logran unido a nuestra expectativa (de arriba abajo) de 
que debería haber saxofones tocando en una canción de ese género. 

La mayoría de las grabaciones contemporáneas están llenas de otro tipo 
de ilusión auditiva. La reverberación artificial hace que los vocalistas y las 
guitarras principales suenen como si llegasen de la parte de atrás de una sala 
de conciertos, incluso cuando los estamos oyendo con auriculares y el 
sonido llega de una distancia de unos centímetros de nuestros oídos. 
Técnicas microfónicas pueden hacer que una guitarra suene como si tuviese 
más de tres metros de anchura y los oídos estuviesen justo en la abertura, 
algo imposible en el mundo real, porque las cuerdas tienen que ir por 
encima de ella, y si tus oídos estuviesen realmente allí, el guitarrista estaría 
rasgueando tu nariz. El cerebro utiliza claves sobre el espectro del sonido y 
el tipo de ecos para decirnos cosas sobre el mundo auditivo circundante, 
igual que un ratón utiliza sus bigotes para saber cosas sobre el mundo físico 
que lo rodea. Los ingenieros de grabación han aprendido a remedar esas 
claves para imbuir las grabaciones de una cualidad semejante a la vida, al 
mundo real, aunque se hagan en estudios asépticos. 

Hay un motivo relacionado por el que a tantos nos atrae la música 
grabada actualmente... y sobre todo ahora que son tan frecuentes los 
intérpretes de música personal y la gente oye mucho con auriculares. 


Músicos e ingenieros de grabación han aprendido a crear efectos especiales 
que nos cosquillean el cerebro explotando circuitos neurológicos que 
evolucionaron para discernir rasgos importantes de nuestro entorno 
auditivo. Estos efectos especiales son similares en principio al arte 
tridimensional, al cine o a las ilusiones visuales, cosas que aún no han 
estado a nuestro alrededor el tiempo suficiente para que nuestros cerebros 
hayan desarrollado evolutivamente mecanismos especiales para percibirlas; 
actúan en realidad sobre sistemas perceptuales que tienen otras funciones. 
Como utilizan esos circuitos neurológicos de formas novedosas, nos 
resultan especialmente interesantes. Lo mismo sucede con el modo de hacer 
las grabaciones modernas. 

Nuestros cerebros pueden calcular el tamaño de un espacio cerrado 
basándose en la reverberación y el eco presentes en la señal que nos 
impacta en los oídos. Aunque seamos pocos los que entendamos las 
ecuaciones necesarias para describir cómo una habitación difiere de otra, 
todos podemos decir si estamos en un cuartito de baño azulejado, una sala 
de conciertos de tamaño medio o una gran iglesia de techos altos. Y 
podemos decir cuando oímos grabaciones de voces qué tamaño tiene el 
local o la habitación en que está el locutor o el cantante. Los ingenieros de 
grabación crean lo que yo llamo «hiperrealidades», el equivalente grabado 
del truco cinematográfico de instalar una cámara en el parachoques de un 
coche que va a toda velocidad. Experimentamos impresiones sensoriales 
que en realidad nunca tenemos en el mundo real. 

Nuestro cerebro es exquisitamente sensible a la información temporal. 
Somos capaces de localizar objetos en el mundo basándonos en diferencias 
de sólo unos cuantos milisegundos entre el momento en que llega un sonido 
a un oído y el momento en que llega al otro. Muchos de los efectos 
especiales que tanto nos gusta oír en la música grabada se basan en esta 
sensibilidad. El sonido de guitarra de Pat Metheny o David Gilmour, de 
Pink Floyd, utilizará múltiples demoras de la señal para producir un efecto 
misterioso como del otro mundo que dispara las partes de nuestro cerebro 
de manera que los humanos jamás han experimentado antes, simulando el 
sonido de una curva cerrada con múltiples ecos de una forma que nunca se 


daría en el mundo real, un equivalente auditivo de los espejos de barbería 
que se repetían infinitamente. 

Tal vez la ilusión definitiva en música sea la ilusión de estructura y 
forma. No hay nada en una sucesión de notas en sí que cree las ricas 
asociaciones emotivas que nos evoca la música, nada en una escala, un 
acorde o una secuencia de acordes que nos haga intrínsecamente esperar 
una resolución. Nuestra capacidad para dar sentido a la música se basa en la 
experiencia y en estructuras neuronales que pueden aprender y modificarse 
con cada nueva canción que oímos, y con cada nueva audición de una vieja 
canción. Nuestros cerebros aprenden una especie de gramática musical que 
es específica de la música de nuestra cultura, igual que aprendemos a hablar 
el idioma de nuestra cultura. 

La aportación de Noam Chomsky a la lingúística moderna y a la 
psicología fue proponer que todos hemos nacido con una capacidad innata 
para entender cualquiera de los idiomas del mundo, y que la experiencia 
con un idioma particular conforma, edifica y finalmente poda una red 
compleja e interconectada de circuitos neuronales. Nuestro cerebro no sabe 
antes de que nazcamos a qué lenguaje estaremos expuestos, pero el cerebro 
y los idiomas naturales coevolucionaron de manera que todos los idiomas 
del mundo comparten ciertos principios fundamentales, y el cerebro tiene la 
capacidad de incorporar cualquiera de ellos, casi sin esfuerzo, a través de la 
mera exposición a él durante una etapa crítica del desarrollo neuronal. 

Así mismo, parece ser que todos tenemos una capacidad innata para 
aprender cualquiera de las músicas del mundo, aunque también ellas 
difieran de formas sustanciales entre sí. El cerebro pasa después del 
nacimiento por un período de rápido desarrollo neuronal que continúa 
durante los primeros años de la vida. Durante ese período, se están 
formando nuevas conexiones neuronales más rápidamente que en cualquier 
otro período de la vida, y durante los años del período medio de la infancia 
el cerebro empieza a podar esas conexiones, reteniendo sólo las más 
importantes y las utilizadas más a menudo. Esto se convierte en la base de 
nuestra comprensión de la música, y en último término en la base de lo que 
nos gusta en música, qué música nos conmueve y cómo nos conmueve. Eso 
no quiere decir que no podamos aprender a apreciar nueva música en la 


edad adulta, pero los elementos estructurales básicos se incorporan al 
cableado mismo de nuestros cerebros cuando escuchamos música en la 
primera etapa de la vida. 

Se puede concebir, pues, la música como un tipo de ilusión perceptiva 
en la que nuestro cerebro impone orden y estructura a una sucesión de 
sonidos. Cómo nos lleva exactamente esa estructura a experimentar 
reacciones emotivas es parte del misterio de la música. Después de todo, no 
nos asoman lágrimas a los ojos con otro tipo de estructuras de nuestra vida, 
como un talonario de cheques o la colocación en orden de productos de 
primeros auxilios en una farmacia (bueno, al menos no a la mayoría). ¿Qué 
es lo que tiene ese tipo particular de orden que encontramos en la música 
que tanto nos conmueve? La estructura de escalas y acordes tiene algo que 
ver con ello, y también la estructura del cerebro. En él, detectores de rasgos 
trabajan para extraer información de la corriente de sonidos que nos 
impacta en los oídos. El sistema computacional del cerebro agrupa esos 
sonidos en un todo coherente, basado en parte en lo que cree que debería 
estar oyendo, y en parte en expectativas. De dónde vienen exactamente esas 
expectativas es una de las claves para entender cómo la música nos 
conmueve, cuando nos conmueve, y por qué alguna música sólo nos hace 
querer estirar la mano para apagar la radio o el reproductor de CD. El tema 
de las expectativas musicales tal vez sea el área de la neurociencia cognitiva 
de la música que une más armoniosamente la teoría de la música y la teoría 
neuronal, a músicos y científicos, y para entenderla plenamente, tenemos 
que estudiar cómo determinadas pautas de la música dan origen a 
determinadas pautas de activaciones neuronales en el cerebro. 


4 


ANTICIPACIÓN 


QUÉ ESPERAMOS DE LISZT (Y DE LUDACRIS) 


Cuando estoy en una boda, no es la visión de la esperanza y el amor de la 
novia y el novio delante de sus amigos y su familia, toda su vida ante ellos, 
lo que hace que asomen lágrimas a mis ojos. Es la música lo que me hace 
llorar. En una película, cuando dos personas acaban reencontrándose 
después de superar grandes pruebas, es la música la que nos precipita de 
nuevo, a mí y a mis emociones, por el despeñadero sentimental. 

Dije antes que la música es sonido organizado, pero la organización 
tiene que incluir algún elemento de lo inesperado, pues si no resulta 
emotivamente plana y robótica. El aprecio que la música nos inspira está 
estrechamente relacionado con nuestra capacidad de aprender la estructura 
subyacente de la que nos gusta (el equivalente a la gramática en los idiomas 
hablado y de señas) y de hacer predicciones sobre lo que vendrá a 
continuación. Los compositores impregnan la música de emoción sabiendo 
cuáles son nuestras expectativas y controlando luego con toda intención 
cuándo satisfarán eso que esperamos y cuándo no. Los estremecimientos, 
escalofríos y lágrimas que la música nos hace experimentar son el resultado 
de una hábil manipulación de nuestras perspectivas por parte de un 
compositor hábil y de los intérpretes de su creación. 

La ilusión más documentada (o el truco de salón) de la música clásica 
occidental es la cadencia engañosa. Una cadencia es una secuencia de 
acordes que crea una expectativa clara y luego se cierra, en general con una 
resolución satisfactoria. En la cadencia engañosa, el compositor repite la 


secuencia de acordes una y otra vez hasta que ha convencido por fin a los 
oyentes de que recibirán lo que esperan, y luego, en el último minuto, nos 
da un acorde inesperado..., no fuera de tono, sino un acorde que nos dice 
que no se ha terminado todo, un acorde que no resuelve del todo. Haydn 
utiliza con tanta frecuencia la cadencia engañosa que en su caso bordea la 
obsesión. Perry Cook ha comparado esto con un truco de magia: los magos 
crean expectativas y luego las incumplen, todo sin que tú sepas exactamente 
cómo o cuándo van a hacerlo. Los compositores hacen lo mismo. «For No 
One» de los Beatles termina en el acorde V (el grado quinto de la escala en 
la que estamos) y esperamos una resolución que nunca llega..., o al menos 
no llega en esa canción. Aunque la canción siguiente del álbum Revolver 
empieza precisamente con el acorde que estábamos esperando oír. 

La creación y luego la manipulación de expectativas es el corazón de la 
música, y se consigue de innumerables modos. Steely Dan lo hace 
interpretando canciones que son en esencia blues (con progresiones de 
acordes y estructura de blues) pero añadiendo armonías insólitas a los 
acordes que hacen que no parezcan en absoluto blues..., por ejemplo en su 
canción «Chain Lightning». Miles Davis y John Coltrane hicieron carrera 
rearmonizando progresiones de blues para darles nuevos sonidos que 
estaban anclados parcialmente en lo familiar y parcialmente en lo exótico. 
Donald Fagen (de Steely Dan) tiene canciones con ritmos blues/funk que 
nos llevan a esperar la progresión de acordes del blues estándar, pero toda la 
canción está interpretada sobre un solo acorde, sin apartarse en ningún 
momento de esa posición armónica. 

En «Yesterday» la principal frase melódica tiene una longitud de siete 
compases; los Beatles nos sorprenden violando uno de los supuestos más 
básicos de la música popular, la unidad de frase de cuatro u ocho compases 
(casi todas las canciones de rock y pop tienen ideas musicales que están 
organizadas en frases de esas longitudes). En «I Want You (She's So 
Heavy)» los Beatles violan expectativas construyendo primero una 
terminación hipnótica y repetitiva que parece que va a continuar 
eternamente; basándonos en nuestra experiencia con la música rock y las 
terminaciones de esa música, esperamos que la canción vaya lentamente 
reduciendo el volumen, el clásico fundido. En vez de eso, termina con 


brusquedad, y ni siquiera al final de una frase: ¡la terminan justo en medio 
de una nota! 

Los Carpenters utilizan el timbre para violar expectativas de género; 
fueron probablemente el último grupo que la gente esperaba que utilizase 
una guitarra eléctrica distorsionada, pero lo hicieron en «Please Mr. 
Postman» y en algunas canciones más. Los Rolling Stones (una de las 
bandas de rock más duras del mundo en la época) habían hecho lo contrario 
unos cuantos años antes utilizando violines (como por ejemplo, en «Lady 
Jane»). Cuando Van Halen eran el grupo más nuevo y más hip que había, 
sorprendieron a los fans lanzándose a una versión heavy metal y una 
canción vieja no del todo hip de los Kinks, «You Really Got Me». 

También se violan a menudo expectativas de ritmo. Un truco clásico del 
blues eléctrico es que la banda acumule impulso y luego deje por completo 
de tocar mientras el cantante o el guitarrista principal siguen haciéndolo, 
como en «Pride and Joy» de Ray Vaughan, «Hound Dog» de Elvis Presley 
o «One Way Out» de Allman Brothers. La terminación clásica para una 
canción de blues eléctrico es otro ejemplo. La canción se lanza a un tiempo 
sostenido durante dos o tres minutos y... ¡paf! Justo cuando los acordes 
sugieren que es inminente una terminación, en vez de continuar atacando a 
plena velocidad, la banda de pronto empieza a tocar a mitad del tempo en 
que lo estaba haciendo antes. 

En un golpe doble, Creedence Clearwater Revival sale de este final de 
bajada lenta en «Lookin? Out My Back Door» (por entonces ese final era ya 
un tópico sabido) y viola las expectativas de «eso» pasando de nuevo a la 
terminación real de la canción a tempo pleno. 

The Police hizo carrera violando expectativas rítmicas. La convención 
rítmica oficial del rock es tener un contratiempo fuerte (backbeat) en los 
tiempos dos y cuatro. El reggae da la vuelta a esto poniendo la caja clara en 
los tiempos uno y dos y (característicamente) una guitarra en dos y cuatro. 

The Police combinó reggae con rock para crear un nuevo sonido que 
cumplía con algunas expectativas rítmicas y violaba de manera simultánea 
otras. Sting tocaba a menudo partes de bajo que eran completamente 
novedosas, evitando los tópicos del rock de tocar con el primer tiempo o de 
tocar en sintonía con el bombo. Como me dijo (cuando compartimos un 


despacho en un estudio de grabación en los años ochenta) Randy Jackson, 
famoso por American Idol, y uno de los contrabajistas de sesión más 
sobresalientes, las líneas de bajo de Sting son distintas de todas las demás, y 
ni siquiera encajarían en las canciones de ningún otro. «Spirits in the 
Material World», de su álbum Ghost in the Machine, lleva este juego 
rítmico a un extremo tal que resulta difícil decir incluso dónde está el 
primer tiempo. 

Compositores modernos como Schónberg se desprenden de toda la idea 
de expectación. Las escalas que utilizan nos privan de la noción de una 
resolución, una raíz para la escala, o un «hogar» musical, creando así la 
ilusión de ningún hogar, de una música a la deriva, tal vez como una 
metáfora de la vivencia existencialista del siglo xx (o sólo porque 
intentaban ir en contra). Aún oímos esas escalas utilizadas en películas para 
acompañar secuencias de sueño o para transmitir una falta de base o en 
escenas debajo del agua o del espacio exterior para transmitir ingravidez. 

Estos aspectos de la música no están representados directamente en el 
cerebro, al menos no durante las etapas iniciales de procesamiento. El 
cerebro construye su propia versión de la realidad, basada sólo en parte en 
ella, y en parte en cómo interpreta las notas que oímos en función del papel 
que juegan en un sistema musical aprendido. Interpretamos el lenguaje 
hablado de modo análogo. No hay nada intrínsecamente gatuno en la 
palabra «gato», ni siquiera en sus sílabas. Hemos aprendido que esa 
colección de sonidos representa al animal doméstico. Del mismo modo, 
hemos aprendido que ciertas secuencias de tonos van juntas, y esperamos 
que continúen haciéndolo. Esperamos que se den a la vez ciertos tonos, 
ritmos, timbres, etc., basados en un análisis estadístico que ha efectuado 
nuestro cerebro de la frecuencia con que han ido juntos en el pasado. 
Tenemos que rechazar la idea intuitivamente atractiva de que el cerebro está 
almacenando una representación exacta y rigurosamente isomórfica del 
mundo. Está almacenando, en cierta medida, distorsiones perceptivas, 
ilusiones, y extrayendo relaciones entre elementos. Está computando una 
realidad para nosotros, una realidad rica en belleza y en complejidad. Una 
prueba básica de ese punto de vista es el hecho simple de que las ondas 
luminosas varían en el mundo a lo largo de una dimensión (longitud de 


onda) y sin embargo nuestro sistema perceptivo trata el color como 
bidimensional (el círculo de color descrito en la página 38). Lo mismo 
sucede con el tono: a partir de un continuo unidimensional de moléculas 
que vibran a velocidades diferentes, nuestro cerebro construye un espacio 
tonal rico y multidimensional con tres, cuatro o incluso cinco dimensiones 
(según algunos modelos). Si nuestro cerebro está añadiendo todas esas 
dimensiones a lo que hay en el exterior, esto puede ayudar a explicar las 
reacciones profundas que nos producen los sonidos que están 
adecuadamente construidos y combinados con habilidad. 

Cuando los científicos cognitivos hablamos de expectativas y de 
violarlas, nos referimos a un fenómeno cuya aparición choca con lo que 
podría haberse predicho razonablemente. Está claro que sabemos mucho 
sobre una serie de diferentes situaciones estándar. La vida nos ofrece 
situaciones similares que difieren sólo en detalles, y esos detalles son a 
menudo insignificantes. Aprender a leer es un ejemplo. Los extractores de 
rasgos distintivos de nuestro cerebro han aprendido a detectar el aspecto 
esencial e invariable de las letras del alfabeto, y a menos que prestemos 
atención de forma explícita, no advertimos detalles como el tipo de letra 
con que está escrita una palabra. Aun a pesar de que detalles 
superficiales sean diferentes, todas estas palabras son igualmente 


identificables, así como las letras individuales. (Puede resultar 
discordante leer frases en las que cada palabra está en un tipo de letra 
distinto, y por supuesto ese cambio rápido nos hace darnos cuenta de ello, 
pero lo cierto es que nuestros detectores de rasgos distintivos están 
ocupados extrayendo cosas como «la letra a» más que procesando la fuente 
en la que está escrita.) 

Una forma importante que tiene nuestro cerebro de tratar con 
situaciones estándar es extraer aquellos elementos que son comunes a 
múltiples situaciones y crear una estructura dentro de la cual emplazarlas; 
esa estructura se llama un esquema. El esquema para la letra a sería una 
descripción de su forma, y quizá una serie de rasgos mnemotécnicos que 
incluya todas las as que hemos visto a lo largo de la vida, que muestre la 
variabilidad que acompaña al esquema. Los esquemas nos informan sobre 
una gran cantidad de interacciones cotidianas que tenemos con el mundo. 


Por ejemplo, hemos estado en fiestas de cumpleaños y tenemos una idea 
general (un esquema) de lo que es común a esas fiestas. El esquema de la 
fiesta de cumpleaños será diferente para culturas diferentes (como la 
música), y para gente de edades diferentes. El esquema conduce a 
expectativas claras y aportan además un sentido de cuáles de esas 
expectativas son flexibles y cuáles no lo son. Podemos hacer una lista de 
cosas que esperaríamos encontrar en una fiesta de cumpleaños típica. No 
nos sorprendería el que no estuviesen presentes en todas ellas, pero cuantas 
más falten, menos típica sería la fiesta: 


— Una persona que está celebrando el aniversario de su nacimiento 
— Otra gente que ayuda a esa persona a celebrarlo 

— Una tarta con velas 

— Regalos 

— Comida de fiesta 

— Sombreros de fiesta, trompetitas y otros adornos 


Si la fiesta fuese para un niño de ocho años podríamos tener la expectativa 
adicional de que habría juegos infantiles, pero no whisky de malta. Esto 
más o menos constituye nuestro esquema de fiesta de cumpleaños. 

También tenemos esquemas musicales, y estos empiezan a formarse en 
el vientre materno y se elaboran, se enmiendan y reciben nueva información 
cada vez que escuchamos música. Nuestro esquema musical para la música 
occidental incluye un conocimiento implícito de las escalas que se utilizan 
normalmente. Ésa es la razón de que la música india o paquistaní, por 
ejemplo, nos parezca «extraña» la primera vez que la oímos. No les parece 
extraña a indios y paquistaníes y tampoco a los niños pequeños (o al menos 
no más extraña que cualquier otra música). Esto puede resultar obvio, pero 
parece extraña porque no se atiene a lo que hemos aprendido a llamar 
música. Los niños pequeños, a los cinco años de edad, han aprendido a 
identificar progresiones de acordes en la música de su cultura: están 
formando esquemas. 

Desarrollamos esquemas para estilos y géneros musicales determinados; 
«estilo» no es más que una forma de decir «repetición». Nuestro esquema 


para un concierto de Lawrence Welk incluye acordeones, pero no guitarras 
eléctricas distorsionadas, y nuestro esquema para un concierto de Metallica 
es lo contrario. Un esquema para Dixieland incluye música con ritmo 
rápido y zapateo, y a menos que la banda estuviese intentando ironizar, no 
esperaríamos que hubiese superposición entre su repertorio y el de un 
cortejo fúnebre. Los esquemas son una extensión de la memoria. Como 
oyentes, nos damos cuenta de cuándo estamos oyendo algo que hemos oído 
antes, y podemos determinar si lo oímos anteriormente en la misma pieza o 
en una distinta. Escuchar música exige, de acuerdo con el teórico Eugene 
Narmour, que seamos capaces de retener en la memoria un conocimiento de 
aquellas notas que acaban de pasar, junto con un conocimiento de todas las 
otras músicas con las que estamos familiarizados que se aproximan al estilo 
de lo que estamos oyendo. Este último recuerdo puede no tener el mismo 
nivel de resolución o el mismo grado de intensidad que las notas que 
acabamos de oír, pero es necesario para poder establecer un contexto para 
las que estamos oyendo. 

Los esquemas principales que elaboramos incluyen un vocabulario de 
géneros y estilos, así como de períodos (la música de los años setenta suena 
distinta que la de los años treinta), ritmos, progresiones de acordes, 
estructura de frase (cuántos compases por frase), cómo es de larga una 
canción y qué notas suelen seguir a qué. Cuando dije antes que la canción 
popular estándar tiene frases de cuatro u ocho compases de longitud, esto es 
una parte del esquema que hemos elaborado para las canciones populares de 
finales del siglo xx. Hemos oído miles de canciones miles de veces y, 
aunque no seamos Capaces de describirlo explícitamente, hemos 
incorporado esa tendencia de frase como una «regla» respecto a la música 
que desconocemos. Cuando se toca «Yesterday» con su frase de siete 
compases, es una sorpresa. Aunque la hayamos oído un millar o incluso 
diez millares de veces, aún sigue interesándonos porque viola expectativas 
esquemáticas que están aún más firmemente arraigadas que nuestro 
recuerdo de esa canción concreta. Canciones a las que seguimos volviendo 
durante años juegan con expectativas justo lo suficiente para que resulten al 
menos un poquito sorprendentes. Steely Dan, los Beatles, Rachmaninoff y 


Miles Davis son sólo unos cuantos de los artistas de los que algunas 
personas dicen que nunca se cansan, y la razón es en gran parte esa. 

La melodía es uno de los medios primordiales que tienen los 
compositores de controlar nuestras expectativas. Los teóricos de la música 
han identificado un principio denominado llenar un hueco; en una secuencia 
de tonos, si una melodía da un salto grande, bien hacia arriba o bien hacia 
abajo, la nota siguiente debería cambiar de dirección. Una melodía típica 
incluye mucho movimiento gradual, es decir, notas adyacentes de la escala. 
Si la melodía da un gran salto, los teóricos dicen que «quiere» volver al 
punto desde el que saltó; esto es otra forma de decir que el cerebro espera 
que el salto sea sólo temporal, y las notas que siguen deben ir acercándonos 
más y más a nuestro punto de partida, u «hogar» armónico. 

En «Somewhere Over the Rainbow» la melodía empieza con uno de los 
saltos más grandes que podamos haber experimentado en toda una vida 
escuchando música: una octava. Se trata de una violación fuerte del 
esquema, y por ello el compositor nos recompensa y aplaca volviendo a 
llevar de nuevo la melodía a casa, pero no demasiado (baja, pero sólo un 
grado de la escala) porque quiere seguir creando tensión. La tercera nota de 
esta melodía llena el hueco. Sting hace lo mismo en «Roxanne»: salta un 
intervalo de aproximadamente media octava (una cuarta perfecta) para 
atacar la primera sílaba de la palabra Roxanne, y luego baja de nuevo para 
llenar el hueco. 

También oímos cómo se llena el hueco en el andante cantabile de la 
Sonata «Patética» de Beethoven. Cuando el tema principal escala hacia 
arriba, pasa de un do (en la tonalidad de la bemol es el tercer grado de la 
escala) a un la bemol que está una octava por encima de lo que 
consideramos la nota «hogar», y sigue subiendo hasta si bemol. Una vez 
que estamos una octava y un tono por encima de ese hogar, sólo hay un 
camino a seguir, volver de nuevo a casa. Beethoven salta realmente hacia 
casa, baja un intervalo de una quinta, aterrizando en la nota (si bemol) que 
está un quinto por encima de la tónica. Para dilatar la resolución (Beethoven 
era un maestro del suspense) en vez de continuar el descenso hacia la 
tónica, se aparta de ella. Al saltar hacia abajo desde si bemol alto hasta mi 
bemol, estaba enfrentando dos esquemas entre sí: el de resolver hacia la 


tónica y el de llenar el hueco. Desviándose de la tónica en ese punto, está 
llenando también el hueco que hizo saltando tan abajo para llegar a este 
punto medio. Cuando finalmente nos lleva a casa dos compases más tarde 
lo hace con una resolución que es la más dulce que hayamos podido oír 
jamás. 

Consideremos ahora lo que hace Beethoven con las expectativas de la 
melodía en el tema principal del último movimiento de su Novena Sinfonía 
(«Oda a la Alegría»). Éstas son las notas de la melodía: 


mi - mi - fa - sol - sol - fa - mi - re - do - do - re - mi - mi - re - re 


¡El tema melódico principal consiste simplemente en las notas de la escala! 
La secuencia de notas más conocida, escuchada y utilizada que tenemos en 
la música occidental. Pero Beethoven lo hace interesante violando nuestras 
expectativas. Empieza con una nota extraña y termina con una nota extraña. 
Empieza en el tercer grado de la escala (como hizo en la Sonata «Patética»), 
en vez de hacerlo en la raíz, y luego sube de forma escalonada, para dar 
después la vuelta y empezar a bajar otra vez. Cuando llega a la raíz (la nota 
más estable) en vez de quedarse allí sube de nuevo, hasta la nota con la que 
empezamos, luego baja otra vez para que pensemos y esperemos que llegue 
de nuevo a la raíz, pero no lo hace; se queda justo allí en re, el segundo 
grado de la escala. La pieza necesita resolver llegando a la raíz, pero 
Beethoven nos mantiene allí pendientes, donde menos esperábamos estar. 
Luego vuelve a recorrer todo el motivo, y sólo en la segunda vez que lo 
hace satisface nuestras expectativas. Pero ahora, esa expectativa es aún más 
interesante debido a la ambigiedad: nos preguntamos, como Lucy cuando 
espera por Charlie Brown, si nos quitará el balón de la resolución en el 
último minuto. 


¿Qué sabemos de la base neuronal de las expectativas musicales y de la 
emoción musical? Si aceptamos que el cerebro está construyendo una 
versión de la realidad, debemos rechazar que tenga una representación 
exacta y estrictamente isomórfica del mundo. ¿Qué guarda pues el cerebro 
en sus neuronas que representa el mundo que nos rodea? El cerebro 
representa toda la música y todos los otros aspectos del mundo en términos 


de códigos mentales o neuronales. Los neurocientíficos intentan descifrar 
esos códigos, entender su estructura, y cómo se traducen en experiencia. 
Los psicólogos cognitivos intentan comprender esos códigos a un nivel un 
poco más elevado: no al de las activaciones neuronales, sino al de los 
principios generales. 

El modo de operar de tu ordenador al archivar una imagen es similar, en 
principio, al modo de operar del código neuronal. Cuando archivas una 
imagen en el ordenador, no se guarda en el disco duro del mismo modo que 
se guarda una fotografía en el álbum de fotos de la abuela. Cuando abres el 
álbum de tu abuela, puedes coger una foto, darle la vuelta, pasársela a un 
amigo; es un objeto físico. Es la fotografía, no una representación de una 
fotografía. Sin embargo, en el ordenador una foto está guardada en un 
archivo hecho de 0 y 1, el código binario que los ordenadores utilizan para 
representarlo todo. 

Si has abierto alguna vez un archivo estropeado, o si tu programa de 
correo electrónico no bajó bien un archivo adjunto, verás probablemente un 
galimatías en vez de lo que tú creías que era un archivo informático: una 
hilera de símbolos extraños, garabatos y caracteres alfanuméricos que 
parece el equivalente de los tacos en un tebeo. (Son una especie de código 
hexadecimal intermedio que se compone también de O y 1, pero esta etapa 
intermedia no es determinante para comprender la analogía.) En el caso más 
sencillo de una foto en blanco y negro, un 1 podría representar que hay un 
punto negro en un lugar determinado de la foto, y un O podría indicar la 
ausencia de un punto negro, o un punto blanco. Puedes aceptar que se 
podría representar con facilidad una forma geométrica simple utilizando 
estos ceros y unos, pero los O y 1 no tendrían la forma de un triángulo, 
serían sólo parte de una larga línea de 0 y 1, y el ordenador tendría una serie 
de instrucciones que le indicarían cómo interpretarlos (y a qué localización 
espacial correspondía cada número). Si fueses realmente bueno leyendo un 
archivo de este tipo, podrías ser capaz de descifrarlo y de saber qué imagen 
representa. La situación es inmensamente más complicada con una imagen 
en color, pero el principio es el mismo. La gente que trabaja con archivos de 
imágenes continuamente es capaz de mirar el río de 0 y 1 y decir algo sobre 
la naturaleza de la foto..., tal vez no en lo que se refiere si es un ser humano 


o un Caballo, sino cosas como cuánto rojo o gris hay en la imagen, los 
líquidos que son los contornos, etc. Han aprendido a leer el código que 
representa la imagen. 

Los archivos de audio se archivan también en formato binario, como 
secuencias de O y 1. Los O y 1 representan si hay o no algún sonido en 
puntos concretos del espectro de frecuencias. Una secuencia determinada de 
0 y 1 indicará, según cuál sea su posición en el archivo, si está tocando un 
timbal o un flautín. 

En los casos que acabo de describir, el ordenador utiliza un código para 
representar objetos auditivos visuales comunes. Los objetos en sí se 
descomponen en pequeños componentes (píxeles en el caso de una imagen, 
ondas sinusoidales de una frecuencia y una amplitud determinadas en el 
caso del sonido) y estos componentes se traducen en el código. Por 
supuesto, el ordenador (el cerebro) maneja un montón de fantásticos 
programas (la mente) que traducen sin esfuerzo el código. La mayoría de 
nosotros no tenemos que preocuparnos en absoluto por el código en sí. 
Escaneamos una foto o grabamos una canción en nuestro disco duro y 
cuando queremos verla u oírla, hacemos un doble clic sobre ella y aparece 
ante nosotros en toda su gloria original. Se trata de una ilusión que hacen 
posible las muchas capas de traducción y amalgamado que se desarrollan en 
unos procesos absolutamente invisibles para nosotros. Así es como opera 
también el código neuronal. Millones de nervios que se activan a 
velocidades e intensidades diferentes, todo ello invisible para nosotros. No 
podemos percibir cómo se activan nuestros nervios; no sabemos cómo 
acelerarlos, cómo aminorarlos, cómo conectarlos cuando nos cuesta 
ponerlos en marcha al levantarnos con ojos soñolientos o cómo 
desconectarlos para poder dormir de noche. 

Hace años, mi amigo Perry Cook y yo nos quedamos asombrados 
cuando leímos su artículo sobre un hombre que podía mirar discos 
fonográficos e identificar la pieza de música que había en ellos, mirando los 
surcos, con la etiqueta tapada. ¿Memorizaba las pautas de miles de 
álbumes? Perry y yo sacamos unos cuantos álbumes viejos de discos y 
apreciamos algunas regularidades. Los surcos de un disco de vinilo contiene 
un código que la aguja «lee». Las notas bajas crean surcos anchos, las 


agudas surcos estrechos y la aguja introducida en los surcos se mueve miles 
de veces por segundo para captar el paisaje de las paredes interiores. Si una 
persona supiese bien muchas piezas de música, podría sim duda 
Caracterizarlas por el número de notas graves que contuviesen (la música 
rap tiene muchísimas, los conciertos barrocos no), la proporción entre el 
número de notas bajas regulares y percursivas (piensa en una melodía de 
jazz swing con «bajo caminando» frente a una melodía funk con «bajo 
palmeando») y saber cómo esas formas están cifradas en vinilo. Las 
habilidades de ese individuo son extraordinarias, pero no inexplicables. 

Nos encontramos todos los días con magníficos lectores de códigos 
auditivos: el mecánico que es capaz de saber escuchando el ruido del motor 
de tu coche si tus problemas se deben a inyectores de gasolina bloqueados o 
a una Cadena de distribución desplazada; el médico que es capaz de saber 
escuchando los latidos de tu corazón si tienes arritmia; el policía que es 
Capaz de saber si un sospechoso está mintiendo por la tensión de su voz; el 
músico que es capaz de distinguir una viola de un violín o un clarinete en si 
bemol de un clarinete en mi bemol sólo por el sonido. En todos esos casos 
el timbre desempeña un papel importante ayudándonos a descifrar el 
código. 

¿Cómo podemos estudiar códigos neuronales y aprender a 
interpretarlos? Algunos neurocientíficos empiezan estudiando neuronas y 
sus características, qué es lo que hace que se activen, la rapidez con que lo 
hacen, cuál es su período refractario (cuánto necesitan para recuperarse 
entre una activación y otra); estudiamos cómo se comunican entre sí las 
neuronas y el papel de los neurotransmisores en la transferencia de 
información en el cerebro. Gran parte del trabajo a este nivel de análisis 
está relacionado con principios generales; aún no sabemos gran cosa sobre 
la neuroquímica de la música, por ejemplo, aunque revelaré algunos nuevos 
resultados emocionantes en ese campo de mi laboratorio en el capítulo 5. 

Pero he de dar marcha atrás un momento. Las neuronas son las células 
primarias del cerebro; se encuentran también en la espina dorsal y en el 
sistema nervioso periférico. La actividad de fuera del cerebro puede hacer 
que una neurona se active: por ejemplo, cuando una nota de una frecuencia 
determinada excita la membrana basilar y ésta a su vez transmite una señal 


a unas neuronas del córtex auditivo que seleccionan frecuencias. En contra 
de lo que pensábamos hace cien años, las neuronas del cerebro no se tocan 
en realidad; hay un espacio entre ellas llamado sinapsis. Cuando decimos 
que una neurona se está activando es que esta enviando una señal eléctrica 
que provoca la emisión de un neurotransmisor. Los neurotransmisores son 
sustancias químicas que viajan por el cerebro y unen receptores vinculados 
a Otras neuronas. Receptores y neurotransmisores pueden compararse 
respectivamente a cerraduras y llaves. Cuando una neurona se activa, un 
neurotransmisor cruza nadando la sinapsis hasta una neurona próxima y 
cuando encuentra la cerradura y se une a ella, esa nueva neurona se activa. 
No todas las llaves encajan en todas las cerraduras; hay ciertas cerraduras 
(receptores) que están diseñadas para aceptar sólo determinados 
neurotransmisores. 

Los neurotransmisores provocan generalmente que la neurona receptora 
se active o impiden que lo haga. Se absorben a través de un proceso 
denominado recaptación; sin recaptación los neurotransmisores seguirían 
estimulando o inhibiendo la activación de la neurona. 

Algunos neurotransmisores se utilizan en todo el sistema nervioso, y 
otros sólo en determinadas regiones cerebrales y por ciertos tipos de 
neuronas. La serotonina se produce en el tallo cerebral y está relacionada 
con la regulación del estado de ánimo y del sueño. A los antidepresivos de 
nuevo tipo, entre los que se incluyen Prozac y Zoloft, se les conoce como 
inhibidores selectivos de la recaptación de serotonina (SSRIs según las 
siglas en inglés) porque inhiben la recaptación de serotonina en el cerebro, 
permitiendo que la que ya esté allí actué durante un período de tiempo más 
prolongado. No conocemos el mecanismo preciso por el que esto alivia la 
depresión, el trastorno obsesivo-compulsivo y los trastornos del sueño y del 
estado de ánimo. La dopamina, que segrega el núcleo accumbens, participa 
en la regulación del estado de ánimo y en la coordinación del movimiento. 
Es famosa sobre todo por formar parte del sistema de placer y recompensa 
del cerebro. Cuando los adictos consiguen su droga favorita, o cuando los 
jugadores compulsivos ganan uma apuesta (incluso cuando los 
chocolateadictos consiguen chocolate) es éste el neurotransmisor que actúa. 


Su papel (y el papel importante que tiene el núcleo accumbens) en la 
música no se conoció hasta 2005. 

La neurociencia cognitiva ha conseguido hacer grandes progresos a lo 
largo de la última década. Sabemos ya mucho más sobre cómo operan las 
neuronas, cómo se comunican, cómo forman redes y cómo se desarrollan a 
partir de sus recetas genéticas. Un hallazgo en el nivel macro sobre la 
función del cerebro es la idea popular sobre especialización hemisférica: la 
idea de que la mitad izquierda del cerebro y la mitad derecha realizan 
funciones cognitivas diferentes. Esto es cierto, sin duda, pero como sucede 
con gran parte de la ciencia que se ha filtrado a la cultura popular, la verdad 
de la historia es un poco más matizada. 

Para empezar, la investigación en que eso está basado se efectuó con 
individuos diestros. Por razones que no están del todo claras, los zurdos (del 
5 al 10 por ciento de la población aproximadamente) o los ambidextros 
tienen a veces la misma organización cerebral que los diestros, pero lo más 
frecuente es que tengan una organización cerebral distinta. Cuando la 
organización cerebral es diferente puede adoptar la forma de una simple 
imagen especular, de manera que las funciones estén simplemente 
trasladadas al lado opuesto. Pero en muchos casos los zurdos tienen una 
organización neuronal que es diferente de formas que aún no están bien 
documentadas. Así que las generalizaciones que hacemos sobre asimetrías 
hemisféricas sólo son aplicables a la mayoría de la población diestra. 

Escritores, hombres de negocios e ingenieros se autocalifican de 
individuos de cerebro izquierdo dominante, y artistas, bailarines y músicos 
como individuos de cerebro derecho dominante. La idea popular de que el 
cerebro izquierdo es analítico y el derecho artístico tiene cierta veracidad, 
pero es claramente simplista. Ambos lados del cerebro participan en el 
análisis y en el pensamiento abstracto. “Todas esas actividades exigen 
coordinación de los dos hemisferios, aunque algunas de las funciones 
particulares participantes estén lateralizadas. 

El procesamiento del lenguaje está localizado primordialmente en el 
hemisferio izquierdo, aunque ciertos aspectos globales del lenguaje 
hablado, como la entonación, el énfasis y la pauta del tono, sea más 
frecuente que queden afectados por una lesión cerebral en el hemisferio 


derecho. La capacidad para distinguir entre una pregunta y una afirmación, 
o entre el sarcasmo y la sinceridad, reside a menudo en esas claves no 
lingúísticas lateralizadas del hemisferio derecho conocidas colectivamente 
como prosodia. Es natural preguntarse si los músicos muestran la asimetría 
opuesta, con el procesamiento ubicado primordialmente en el derecho. Hay 
muchos casos de individuos con lesión cerebral en el hemisferio izquierdo 
que pierden la capacidad de hablar, pero retienen su función musical, y 
viceversa. Esos casos sugieren que, aunque música y habla puedan 
compartir algunos circuitos neuronales, no pueden utilizar estructuras 
neuronales completamente superpuestas. 

Rasgos locales de la lengua hablada, como distinguir un sonido del 
habla de otro, parecen estar lateralizados en el hemisferio izquierdo. 
También hemos encontrado lateralización en la base cerebral de la música. 
El contorno global de una melodía (sólo la forma melódica, ignorando los 
intervalos) se procesa en el hemisferio derecho, que efectúa delicadas 
diferenciaciones de notas que están próximas en el tono. En 
correspondencia con sus funciones lingiísticas, el hemisferio izquierdo 
participa en los aspectos denominativos de la música, como nombrar una 
canción, un intérprete, un instrumento o un intervalo musical. Los músicos 
que utilizan la mano derecha o leen música con el ojo derecho utilizan 
también el cerebro izquierdo, porque la mitad izquierda del cerebro controla 
la mitad derecha del cuerpo. Hay también nuevas pruebas de que el 
seguimiento del desarrollo de un tema musical (pensar en notas y escalas y 
en si una pieza musical tiene sentido o no) está lateralizado en los lóbulos 
frontales izquierdos. 

La formación musical parece tener como consecuencia que parte del 
procesamiento de la música cambie del hemisferio (imagístico) derecho al 
hemisferio izquierdo (lógico) cuando los músicos aprenden a hablar de 
música, y tal vez a pensar en ella, utilizando términos lingúísticos. Y el 
curso normal del desarrollo parece causar una mayor especialización 
hemisférica: los niños muestran menos lateralización de las operaciones 
musicales de la que muestran los adultos, independientemente de que sean 
músicos O no. 


Lo mejor para empezar a examinar la expectación en el cerebro musical es 
analizar cómo seguimos las secuencias de acordes en la música a lo largo 
del tiempo. La diferencia más importante entre el arte visual y la música es 
que ésta se manifiesta a lo largo del tiempo. Las notas, como se despliegan 
secuencialmente, nos inducen (a nuestros cerebros y a nuestras mentes) a 
hacer predicciones sobre lo que vendrá a continuación. Esas predicciones 
son la parte esencial de las expectativas musicales. Pero ¿cómo podemos 
estudiar su base cerebral? 

Las activaciones neuronales producen una pequeña corriente eléctrica, y 
esa corriente se puede medir con el equipo adecuado, lo que nos permite 
saber cuándo y con qué frecuencia se activan las neuronas; a esto es a lo 
que se llama electroencefalograma, o EEG. Se colocan electrodos (es 
indoloro) sobre la superficie del cuero cabelludo, de una forma muy 
parecida a como podría fijarse con esparadrapo un monitor cardíaco en un 
dedo, en la muñeca o en el pecho. El EEG es extremadamente sensible 
cronometrando activaciones neuronales, y puede detectar actividad con una 
resolución de una milésima de segundo (un milisegundo). Pero tiene 
algunas limitaciones. No es capaz de precisar si la actividad neuronal está 
liberando neurotransmisores excitatorios, inhibitorios o modulatorios, las 
substancias químicas, como la serotonina y la dopamina, que influyen en el 
comportamiento de otras neuronas. Debido a que la firma eléctrica generada 
por una sola neurona activándose es relativamente débil, el 
electroencefalograma sólo capta la activación sincrónica de grandes grupos 
de neuronas y no la de neuronas individuales. 

El electroencefalograma tiene también una resolución espacial limitada: 
es decir, una capacidad limitada para decirnos el emplazamiento de las 
activaciones neuronales, debido a lo que se llama el problema de Poisson 
inverso. Imagina que estás en un estadio de fútbol cubierto por una gran 
cúpula semitransparente. Tienes una linterna y apuntas con ella hacia arriba, 
a la superficie interior de la cúpula. Mientras tanto, yo estoy fuera, mirando 
hacia abajo a la cúpula desde lo alto, y tengo que predecir dónde estás tú. 
Podrías estar en cualquier punto del campo de fútbol y dirigir la luz al 
mismo punto concreto del centro de la cúpula, y desde donde yo estoy, me 


parecería siempre el mismo. Podría haber ligeras diferencias en el ángulo o 
en la intensidad de la luz, pero cualquier predicción que yo hiciese sobre tu 
posición no pasaría de ser una conjetura. Y si tú hicieses reflejarse la luz de 
la linterna en espejos y en otras superficies reflectoras antes de que llegase a 
la cúpula, yo estaría aún más perdido. Eso es lo que pasa con las señales 
eléctricas que pueden ser generadas por fuentes múltiples en el cerebro, 
desde la superficie de éste o muy en el interior, en los surcos (sulci), y que 
pueden rebotar de los surcos antes de llegar al electrodo situado en la 
superficie exterior del cuero cabelludo. Aun así, el electroencefalograma ha 
ayudado a comprender la conducta musical porque la música está basada en 
el tiempo, y el electroencefalograma es, de todas las herramientas que 
utilizamos habitualmente para estudiar el cerebro humano, la de mejor 
resolución temporal. 

Varios experimentos realizados por Stefan Koelsch, Angela Friederici y 
sus colegas nos han aclarado aspectos sobre los circuitos neuronales 
implicados en la estructura musical. Los científicos utilizan secuencias de 
acordes que O bien resuelven de la forma esquemática estándar o bien 
terminan en acordes inesperados. Tras iniciarse el acorde, la actividad 
eléctrica del cerebro asociada con la estructura musical se capta en 150-400 
milisegundos (ms) y la actividad asociada con el contenido musical unos 
100-150 ms más tarde. El procesamiento estructural (sintaxis musical) ha 
sido localizado en los lóbulos frontales de ambos hemisferios en áreas 
adyacentes y sobrepuestas a las regiones que procesan la sintaxis del habla, 
como el área de Broca, y se manifiesta de forma independiente de si los 
oyentes tienen o no formación musical. Las regiones implicadas en la 
semántica musical (que asocian la secuencia tonal con el contenido) 
parecen estar en las porciones posteriores del lóbulo temporal, a ambos 
lados, cerca del área de Wernicke. 

El sistema cerebral de la música parece operar con independencia 
funcional del sistema del lenguaje: lo demuestran muchos historiales de 
pacientes que, después de una lesión, pierden una u otra facultad, pero no 
ambas. El caso más famoso tal vez sea el de Clive Wearing, un músico y 
director de orquesta con una lesión cerebral debida a encefalitis por herpes. 
Clive, según informa Oliver Sacks, perdió toda la memoria salvo los 


recuerdos musicales y el recuerdo de su esposa. Se ha informado de otros 
casos en los que el paciente perdió su memoria respecto a la música pero 
conservó el lenguaje y otros recuerdos. Cuando el compositor Ravel sufrió 
un deterioro de algunas partes del córtex izquierdo, perdió de forma 
selectiva el sentido del tono, reteniendo sin embargo el del timbre, déficit 
que inspiró su Bolero, una composición que se centra en variaciones del 
timbre. La explicación más sencilla es que aunque música y lenguaje 
comparten algunos recursos neuronales, tienen también vías independientes. 
La estrecha proximidad del procesamiento de música y habla en los lóbulos 
frontal y temporal, y su solapamiento parcial, parecen indicar que los 
circuitos neuronales que se reclutan para la música y para el lenguaje 
pueden iniciar su vida indiferenciados. Luego, la experiencia y el desarrollo 
normal diferencian las funciones de las que empezaron siendo poblaciones 
neuronales muy semejantes. Se cree que a una edad muy temprana los 
bebés son sinestésicos, es decir, no pueden diferenciar los mensajes de los 
diferentes sentidos y experimentan la vida y el mundo como una especie de 
unión psicodélica de todo lo sensorial. Los bebés pueden ver el número 
cinco como rojo, gustar quesos de Cheddar en re bemol y oler rosas en 
triángulos. 

El proceso de maduración crea distinciones en las vías neuronales 
cuando se cortan o podan conexiones. Lo que puede haber empezado como 
un grupo neuronal que reaccionaba por igual a la visión, el sonido, el gusto, 
el tacto y el olfato se convierte en una red especializada. Así, también, 
puede que la música y el habla tuviesen los mismos orígenes 
neurobiológicos, compartiesen las mismas regiones y utilizasen las mismas 
redes neuronales específicas. Al aumentar la experiencia y la exposición al 
mundo exterior, el niño pequeño en desarrollo acaba creando vías dedicadas 
a la música y vías dedicadas al lenguaje. Esas vías pueden compartir 
algunos recursos, tal como ha propuesto sobre todo Ani Patel en su 
hipótesis de servicio de integración sintáctica compartido (SSIRH según sus 
siglas en inglés). 

Mi colaborador y amigo Vinod Menon, un neurocientífico de sistemas 
de la facultad de medicina de Stanford, compartió conmigo el interés por 
definir los hallazgos de los laboratorios de Koelsch y Friederici y por 


aportar pruebas sólidas del servicio de integración sintáctica compartido de 
Patel. Para eso, teníamos que utilizar un método de estudio del cerebro 
diferente, ya que la resolución espacial del electroencefalograma no era lo 
bastante precisa para señalar realmente el locus neuronal de la sintaxis 
musical. 

Como la hemoglobina de la sangre es ligeramente magnética, pueden 
rastrearse cambios en la corriente sanguínea con una máquina capaz de 
detectar variaciones de las propiedades magnéticas. Eso es lo que hace una 
máquina de imagen de resonancia magnética (MRI según las siglas en 
inglés), un electroimán gigante que proporciona un informe sobre 
variaciones en las propiedades magnéticas, lo que a su vez puede decirnos 
en qué parte del cuerpo fluye la sangre en un momento dado del tiempo. La 
empresa británica EMI realizó la investigación para desarrollar los dos 
primeros escáneres de imagen de resonancia magnética, con financiación 
procedente en gran parte de los beneficios que obtuvo con los discos de los 
Beatles. «I Want to Hold Your Hand» [Quiero estrecharte la mano] podría 
muy bien haberse titulado «I Want to Scan Your Brain» [Quiero escanearte 
el cerebro]. Como las neuronas necesitan oxígeno para sobrevivir y la 
sangre transporta hemoglobina oxigenada, podemos rastrear el aflujo de 
sangre también en el cerebro. Suponemos que las neuronas que están 
activadas necesitarán más oxígeno que las que están en reposo, así que 
aquellas regiones del cerebro que participan en una tarea cognitiva 
determinada serán aquellas que tengan un mayor aflujo sanguíneo en un 
momento dado. Cuando utilizamos la máquina de MRI para estudiar la 
función de las regiones cerebrales de ese modo, la tecnología se denomina 
MRI funcional o MRIf. 

Las imágenes de MRIf nos permiten ver un cerebro humano vivo en 
funcionamiento mientras está pensando. Si practicas mentalmente tu saque 
de tenis, podemos ver cómo te sube la sangre al córtex motriz, y la 
resolución espacial del MRIf es lo bastante buena para que podamos ver 
que la parte del córtex motriz que se activa es la que controla el brazo. Si 
empiezas luego a resolver un problema matemático, la sangre se mueve 
hacia delante, hacia los lóbulos frontales, y en concreto hacia regiones que 
se ha comprobado que estaban relacionadas con la resolución de problemas 


aritméticos, y vemos ese movimiento y finalmente una acumulación de 
sangre en los lóbulos frontales en el escáner de la MRIf. 

¿Nos permitirá alguna vez esta ciencia frankensteiniana, la ciencia de la 
obtención de imágenes del cerebro, leer la mente de las personas? Me siento 
feliz al poder decir que la respuesta probablemente sea no, y de manera 
rotunda no en un futuro previsible. El motivo es que los pensamientos son 
en realidad demasiado complicados y exigen la participación de demasiadas 
regiones diferentes. Con la MRIf yo puedo decir que estás escuchando 
música y que no estás viendo una película muda, pero aún no si estás 
escuchando hip-hop o canto gregoriano, no digamos ya qué canción 
concreta estás escuchando o qué es lo que estás pensando. 

Con la elevada resolución espacial de la MRIf, podemos decir con un 
margen de sólo un par de milímetros en qué punto del cerebro está 
ocurriendo algo. El problema es que la resolución temporal de la MRIf no 
es demasiado buena debido a la cantidad de tiempo que tarda la sangre en 
redistribuirse en el cerebro, el llamado lapso hemodinámico. Pero otros 
habían estudiado ya el «cuándo» del procesamiento de la estructura musical 
y la sintaxis musical; nosotros queríamos saber el «dónde» y en particular si 
el «dónde» afectaba a áreas que ya se sabía que estaban dedicadas al habla. 
Descubrimos exactamente lo que predecíamos. Al escuchar música y 
atender a sus rasgos sintácticos (su estructura) se activaba una región 
determinada del córtex frontal en el lado izquierdo llamada pars orbitalis 
(una subsección de la región conocida como área 47 de Brodmamn). La 
región que localizamos en nuestro estudio se solapaba en parte con la 
señalada en estudios anteriores sobre la estructura del lenguaje, pero tenía 
también algunas activaciones exclusivas. Además de en esa zona del 
hemisferio izquierdo, descubrimos también activación en la zona análoga 
del hemisferio derecho. Eso nos indicó que atender a la estructura de la 
música es tarea de los dos hemisferios del cerebro, mientras que atender a la 
del lenguaje sólo compete al izquierdo. 

Lo más asombroso fue que las regiones del hemisferio izquierdo que 
descubrimos que se activaban en la tarea de rastrear la estructura musical 
eran exactamente las mismas que se activan en los sordos cuando se 
comunican por lenguaje de señas. Eso significaba que lo que habíamos 


identificado en el cerebro no era una región que se limitase a determinar si 
una secuencia de acordes era razonable, o si una frase hablada era 
razonable. Estábamos ante una región que reaccionaba a la visión: a la 
organización visual de palabras transmitidas a través del lenguaje de señas. 
Encontramos pruebas de la existencia de una región del cerebro que procesa 
la estructura en general, cuando esa estructura se transmite a lo largo del 
tiempo. Aunque los mensajes recibidos en esa región deben haber 
procedido de poblaciones neuronales diferentes, y los emitidos por ella 
tuviesen que pasar por redes diferenciadas, allí estaba: una región que se 
activaba en cualquier tarea que entrañase organizar información a lo largo 
del tiempo. 

La idea de la organización neuronal de la música iba haciéndose más 
clara. Todos los sonidos empiezan en el tímpano. Inmediatamente, se 
segregan por la altura del tono. Poco después, es probable que lenguaje y 
música diverjan en circuitos de procesamiento separados. Los del lenguaje 
descomponen la señal con el fin de identificar fonemas individuales: las 
consonantes y vocales que componen nuestro alfabeto y nuestro sistema 
fonético. Los circuitos de la música empiezan a descomponer la señal y a 
analizar por separado tono, timbre, contorno y ritmo. Los mensajes de las 
neuronas que realizan estas tareas conectan con regiones del lóbulo frontal 
que lo agrupan todo e intentan determinar si hay alguna estructura o algún 
orden en la pauta temporal del conjunto. Los lóbulos frontales acceden al 
hipocampo y a regiones del interior del lóbulo temporal y preguntan si hay 
algo en nuestros bancos de memoria que pueda ayudar a entender esa señal. 
¿He oído yo antes esa pauta concreta? Y si es así, ¿cuándo? ¿Qué significa? 
¿Forma parte de una secuencia mayor cuyo significado se está desplegando 
en este momento delante de mí? 

Después de haber concretado algo sobre la neurobiología de la 
estructura musical y de la expectación musical, estamos ya en condiciones 
de preguntarnos por los mecanismos cerebrales subyacentes de la emoción 
y el recuerdo. 
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SABES MI NOMBRE. BUSCA EL NÚMERO 


CÓMO CATEGORIZAMOS LA MÚSICA 


Uno de mis primeros recuerdos de la música es cuando era un niño de tres 
años y estaba tumbado en el suelo debajo del piano de cola de la familia 
mientras mi madre tocaba. Tumbado en nuestra alfombra de lana verde y 
peluda, con el piano encima de mí, lo único que veía eran las piernas de mi 
madre moviendo los pedales arriba y abajo, pero el sonido... ¡me envolvía! 
Me rodeaba por todas partes, vibrando a través del suelo y a través de mi 
cuerpo, las notas bajas a mi derecha, las altas a la izquierda. Los fuertes y 
densos acordes de Beethoven; el chaparrón de notas acrobáticas y 
danzarinas de Chopin; los ritmos estrictos, casi militaristas, de Schumann, 
un alemán como mi madre. En estos recuerdos (que figuran entre los 
primeros que tengo de la música) el sonido me mantenía en trance, me 
transportaba a espacios sensoriales en los que nunca había estado. El tiempo 
parecía detenerse mientras sonaba la música. 

¿En qué se diferencian los recuerdos de la música de otros recuerdos? 
¿Por qué puede la música activar en nosotros recuerdos que sin ella 
parecían perdidos o enterrados? Y ¿cómo conduce la expectativa a la 
experiencia de la emoción en música? ¿Cómo reconocemos canciones que 
hemos oído antes? 

El reconocimiento de las canciones entraña una serie de complejos 
cálculos neuronales que interactúan con la memoria. Exige que el cerebro 
no preste atención a ciertos rasgos y nos centremos sólo en otros que son 
invariables de una audición a la siguiente... y extraigamos así las 


propiedades invariables de una canción. Es decir, el sistema computacional 
del cerebro ha de saber separar aquellos aspectos de una canción que se 
mantienen igual cada vez que la oímos, y aquellos que son variaciones 
puntuales, característicos de una presentación concreta. ¡Si el cerebro no 
hiciese eso, cada vez que oyésemos una canción a un volumen distinto, nos 
parecería una canción completamente diferente! Y el volumen no es el 
único parámetro que puede variar sin que resulte afectada la identidad 
subyacente de la canción. La instrumentación, el tempo y el tono se pueden 
considerar irrelevantes desde el punto de vista del reconocimiento de una 
melodía. En el proceso de abstraer los rasgos que son esenciales en la 
identidad de una canción, deben dejarse a un lado los cambios de esos 
rasgos. 

El reconocimiento de la melodía aumenta de forma espectacular la 
complejidad del sistema neuronal necesario para el procesamiento de la 
música. Separar las propiedades invariables de las momentáneas es un 
problema computacional inmenso. Yo trabajé a finales de la década de los 
noventa en una empresa de Internet que elaboraba programas para 
identificar archivos MP3. Mucha gente tiene archivos de sonido en el 
ordenador, pero muchos de ellos o están mal denominados o no lo están 
siquiera. Nadie quiere recorrer un archivo tras otro y corregir errores de 
escritura, como «Etlon John» o cambiar el nombre de canciones como «My 
Name Is True» por «Alison» de Elvis Costello (las palabras my name is true 
son el estribillo del coro, pero no el nombre de la canción). 

Resolver este problema de denominación automática era relativamente 
fácil; cada canción tiene una «huella dactilar» digital y lo único que 
teníamos que hacer era aprender a buscar de forma eficiente en una base de 
datos de medio millón de canciones para identificarlas correctamente. A eso 
se le llama entre los informáticos una «mesa de búsqueda». Equivale a 
buscar tu número de la seguridad social en una base de datos dando tu 
nombre y tu fecha de nacimiento: sólo un número de la seguridad social 
está asociado en teoría con cada individuo, y sólo una fecha de nacimiento. 
Del mismo modo, sólo una canción está asociada con una secuencia 
específica de valores digitales que representan el sonido global de una 
interpretación determinada de esa canción. El programa funciona 


fabulosamente bien en las búsquedas. Lo que no puede hacer es encontrar 
otras versiones de la misma canción en la base de datos. Podría tener ocho 
versiones de «Mr. Sandman» en el disco duro, pero si introdujese la versión 
de Chet Atkins en un programa y le pidiese que buscase otras versiones 
(como las de Jim Campilongo o los Chordettes), no podría. Esto se debe a 
que la corriente digital de números que inicia el archivo MP3 no nos da 
nada que sea fácilmente traducible a melodía, ritmo o intensidad, y aún no 
sabemos cómo hacer esa traducción. Nuestro programa tendría que ser 
capaz de identificar constancias relativas de intervalos melódicos y 
rítmicos, sin tener en cuenta al mismo tiempo detalles de la interpretación 
específica. El cerebro hace eso con facilidad, pero nadie ha inventado un 
ordenador que pueda ni siquiera empezar a hacerlo. 

Esta diferente capacidad de ordenadores y humanos está relacionada 
con un debate sobre la naturaleza y la función de la memoria en los 
humanos. Experimentos recientes sobre la memoria musical han 
proporcionado claves decisivas para aclarar la verdadera cuestión. El gran 
debate entre los teóricos de la memoria a lo largo de los últimos cien años 
ha girado en torno a si la memoria humana y animal es relacional o 
absoluta. La escuela relacional sostiene que nuestro sistema mnemotécnico 
almacena información sobre las relaciones entre objetos e ideas, pero no 
necesariamente detalles sobre los propios objetos. A eso se le llama también 
punto de vista, porque da por supuesto que, a falta de datos sensoriales, 
«construimos» una representación mnemotécnica de la realidad a partir de 
esas relaciones (con muchos detalles añadidos o reconstruidos sobre la 
marcha). Los constructivistas creen que la función de la memoria es no 
tener en cuenta detalles irrelevantes, preservando al mismo tiempo la 
esencia. La teoría rival se llama la teoría de «conservación del registro». 
Los que la apoyan sostienen que la memoria es como una grabadora o una 
videocámara digital y que preserva con exactitud y con una fidelidad casi 
perfecta todas o casi todas nuestras experiencias. 

La música juega un papel en este debate porque (como indicaron hace 
un centenar de años los psicólogos de la Gestalt) las melodías están 
definidas por relaciones de tono (un punto de vista constructivista) y sin 
embargo, están compuestas de tonos precisos (un punto de vista de la 


conservación del registro, aunque sólo si esos tonos están codificados en la 
memoria). 

Se han acumulado muchas pruebas en apoyo de ambos puntos de vista. 
Las favorables a los constructivistas proceden de estudios en los que la 
gente oye hablar (memoria auditiva) o se le pide que lea un texto (memoria 
visual) y luego informa de lo que ha oído o leído. La gente no es demasiado 
buena en la tarea de recrear una relación palabra por palabra, según un 
estudio tras otro. Recuerdan el contenido general, pero no las palabras 
concretas. 

Varios estudios indican también la maleabilidad de la memoria. Da la 
impresión de que intervenciones menores pueden afectar enormemente a la 
exactitud de la recuperación del recuerdo. Elizabeth Loftus, de la 
Universidad de Washington, interesada por la exactitud de los testimonios 
de los testigos en los juicios, realizó una importante serie de estudios. Se 
mostraron a los sujetos cintas de video y se les formularon preguntas 
importantes sobre el contenido. Si se trataba de dos coches que apenas se 
habían rozado, se podía preguntar a un grupo de sujetos: «¿A qué velocidad 
iban los coches cuando se rozaron?». Y a otro grupo se le preguntaba: «¿A 
qué velocidad iban los coches cuando chocaron?». Esas sustituciones de 
una palabra provocaron diferencias espectaculares en las valoraciones de las 
velocidades de los dos vehículos por parte de los sujetos. Luego Loftus 
llamó de nuevo a los sujetos, en algunos casos hasta una semana más tarde, 
y les preguntó: «¿Cuánto cristal roto vio usted?» (no había habido en 
realidad ningún cristal roto). Los sujetos a los que se les formuló la 
pregunta con la palabra chocaron incluida fueron los que más tendieron a 
decir que «recordaban» cristal roto en el vídeo. El recuerdo de lo que 
habían visto en realidad había sido reconstruido basándose en una simple 
pregunta que había formulado el experimentador una semana antes. 

Hallazgos como ésos han llevado a los investigadores a concluir que la 
memoria no es particularmente exacta, y que se reconstruye a base de 
piezas dispares que pueden no ser exactas. La recuperación del recuerdo (y 
tal vez el almacenamiento) pasa por un proceso similar al perceptivo de 
completar o rellenar. ¿Has probado alguna vez a explicarle a alguien a la 
mañana siguiente, en el desayuno, un sueño que tuviste? Nuestro recuerdo 


del sueño suele presentársenos en imágenes fragmentadas y las transiciones 
entre elementos no siempre son claras. Cuando contamos el sueño, 
apreciamos vacíos, y casi no podemos evitar llenarlos durante la narración. 
«Yo estaba fuera en lo alto de una escalera escuchando un concierto de 
Sibelius, y caía del cielo una lluvia de caramelo...», podría empezar. Pero la 
imagen siguiente eres tú bajando la escalera. Añadimos natural y 
automáticamente esta informaron ausente cuando relatamos el sueño. «Y 
decidí protegerme de aquella lluvia, así que empecé a bajar por la escalera 
porque sabía que abajo podía resguardarme...» 

Éste es el cerebro izquierdo hablando (y probablemente la región 
llamada córtex orbitofrontal, justo detrás de la sien izquierda). Cuando 
inventamos una historia es casi siempre el cerebro izquierdo el que se 
encarga de hacerlo. El cerebro izquierdo elabora historias basadas en la 
información muy limitada que consigue. En general recibe correctamente la 
historia, pero se esforzará muchísimo porque resulte coherente. Michael 
Gazzaniga descubrió esto en un trabajo con pacientes comisurotomizados 
(pacientes a los que se les había separado quirúrgicamente los dos 
hemisferios del cerebro para aliviar una epilepsia de difícil tratamiento). 
Gran parte de la información que recibe y emite el cerebro es contralateral: 
el cerebro izquierdo controla el movimiento en la mitad derecha del cuerpo 
y el cerebro izquierdo procesa la información que ve tu ojo derecho. Al 
cerebro izquierdo de un paciente se le mostró una foto de una pata de pollo 
y al cerebro derecho del mismo paciente una casa cubierta de nieve (a 
través de sus ojos derecho e izquierdo respectivamente). Una barrera 
limitaba la visión de los ojos, de forma que cada uno sólo veía una de las 
fotos. Luego se pidió al paciente que seleccionase en una colección de fotos 
la que estaba más íntimamente relacionada con cada una de las dos cosas. 
El paciente señaló un pollo con el cerebro izquierdo (es decir, con la mano 
derecha) y una pala con el derecho. Hasta ahí, todo bien; el pollo va con la 
pata de pollo y la pala con una casa cubierta de nieve. Pero cuando 
Gazzaniga retiró la barrera y preguntó al paciente por qué había elegido la 
pala, su hemisferio izquierdo vio a la vez el pollo y la pala y elaboró una 
historia que era coherente con ambas imágenes. «Necesitas una pala para 
limpiar el gallinero», contestó, sin la menor conciencia de que había visto 


una Casa cubierta de nieve (con su cerebro derecho no verbal), y de que 
estaba inventando una explicación sobre la marcha. Otra prueba más en 
favor de los constructivistas. 

A principios de la década de los sesenta, en el MIT, Benjamin White 
intentó resolver un problema que habían planteado los psicólogos de la 
Gestalt, que se preguntaron cómo era posible que una canción retuviese su 
identidad a pesar de una transposición de tono y ritmo. Alteró para ello 
sistemáticamente canciones muy conocidas como «Deck the Halls» y 
«Michael, Row Your Boat Ashore». En algunos casos transponía todos los 
tonos, en otros modificaba las distancias tonales de manera que quedase 
preservado el contorno, pero los tamaños de los intervalos se ampliaban o 
se reducían. Tocó las melodías hacia delante y hacia atrás y cambió los 
ritmos. La canción deformada fue identificada más veces de lo que podría 
atribuirse a la casualidad en casi todos los casos. 

White demostró que la mayoría de los oyentes pueden reconocer una 
canción sometida a una transposición casi de inmediato sin error. Y eran 
también capaces de reconocer todos los tipos de deformaciones de la 
melodía original. La interpretación constructivista de eso es que el método 
de la memoria debe de extraer cierta información invariable generalizada 
respecto a las canciones y almacenarla. Si fuese cierta la versión de la 
conservación del registro, dicen, harían falta nuevos cálculos cada vez que 
oyésemos una canción sometida a transposición para que nuestros cerebros 
pudiesen comparar la nueva versión con la única representación almacenada 
de la interpretación concreta. Pero en este caso parece que la memoria 
extrae una generalización abstracta para uso posterior. 

La versión de la conservación del registro sigue una vieja idea de mis 
investigadores favoritos, los psicólogos de la Gestalt, que decían que cada 
experiencia deja una huella o residuo en el cerebro. Las experiencias están 
almacenadas como huellas, afirmaban, que son reactivadas cuando 
recuperamos los episodios de la memoria. Gran parte de las pruebas 
experimentales apoyan esta teoría. Roger Shepard mostró en un 
experimento centenares de fotos durante unos cuantos segundos a varios 
sujetos. Una semana después, volvió a llevarles al laboratorio y les mostró 
pares de fotografías que habían visto antes, junto con algunas nuevas que no 


habían visto. En muchos casos, las «nuevas» fotos sólo se diferenciaban de 
las viejas en detalles insignificantes, como el ángulo de la vela de un velero, 
o el tamaño de un árbol situado en segundo plano. Los sujetos fueron 
capaces de recordar cuáles habían visto una semana antes con una exactitud 
pasmosa. 

Douglas Hintzman realizó un estudio en el que mostró a los sujetos 
letras que diferían por ser de diversos tipos de fuentes y por estar escritas 
unas con mayúscula y otras con minúscula. Por ejemplo: 


Flauta 


En contra de los estudios de memoria medular, los sujetos fueron capaces 
de recordar la fuente específica. 

Sabemos también anecdóticamente que la gente puede reconocer 
centenares, y tal vez miles, de voces. Es probable que puedas reconocer el 
sonido de la voz de tu madre en una sola palabra, aunque ella no se 
identifique. Puedes reconocer de inmediato la voz de tu esposa y saber si 
tiene catarro o si está enfadada contigo, todo por el timbre de la voz. Luego 
hay voces muy conocidas, docenas, hasta centenares, que la mayoría de la 
gente puede identificar con facilidad: Woody Allen, Richard Nixon, Drew 
Barrymore, W. C. Fields, Groucho Marx, Katharine Hepburn, Clint 
Eastwood, Steve Martin. Podemos retener en la memoria el sonido de esas 
voces, a menudo cuando formulan un contenido específico o frases hechas: 
«Yo no soy un sinvergienza», «Di la palabra mágica y ganarás cien 
dólares», «Adelante: alégrame la vida», «¡Bueno, peeeerdóname!». 
Recordamos las palabras concretas y las voces concretas, no sólo el meollo. 
Esto apoya la teoría de la conservación del registro. 

Por otra parte, disfrutamos escuchando a los cómicos que imitan las 
voces de celebridades, y a menudo los números más divertidos incluyen 
frases que la celebridad real nunca dijo. Para que esto funcione, tenemos 
que tener algún tipo de huella mnemotécnica almacenada del timbre de la 
voz de la persona, independiente de las palabras concretas. Esto podría 
contradecir la teoría de la conservación del registro, al demostrar que son 
sólo las propiedades abstractas de la voz las que están codificadas en la 


memoria, y no los detalles específicos. Pero podría argumentarse que el 
timbre es una propiedad de los sonidos separable de otros atributos; 
podemos defender nuestra teoría de «conservación del registro» diciendo 
que codificamos valores tímbricos específicos en la memoria y explicar 
pese a ello por qué podemos reconocer el sonido de un clarinete, aunque 
esté tocando una canción que nunca hemos oído. 

Uno de los casos más famosos de la literatura neuropsicológica es el de 
un paciente ruso conocido sólo por su inicial, S., al que trató el médico A. 
R. Luria. Este paciente padecía hipermnesia, que es lo contrario de la 
amnesia: en vez de olvidarlo todo, lo recordaba todo. Era incapaz de darse 
cuenta de que visiones distintas de la misma persona estaban relacionadas 
con un solo individuo. Si veía a una persona sonriendo, eso era una cara; si 
la persona más tarde fruncía el ceño, eso era otra cara. Le resultaba difícil 
integrar las muchas expresiones diferentes y los ángulos de enfoque de una 
persona en una sola representación coherente de esa persona. «¡Tienen 
todos tantas Caras!», se quejaba al doctor Luria. Era incapaz de formar 
generalizaciones abstractas, sólo se mantenía intacto su sistema de 
conservación de registros. Para poder entender el lenguaje hablado, 
necesitamos prescindir de la pronunciación de las palabras de diferentes 
personas, o de cómo la misma persona pronuncia un fonema determinado 
cuando aparece en contextos diferentes. ¿Cómo puede dar cuenta la 
conservación del registro de esto de un modo coherente? 

A los científicos les gusta tener su mundo organizado. Permitir que se 
mantengan dos teorías que hacen predicciones diferentes no es atractivo 
desde el punto de vista científico. Nos gustaría adecentar nuestro mundo 
lógico y elegir una teoría y prescindir de la otra, o elaborar una tercera 
teoría unificadora que lo explicase todo. ¿Qué teoría es correcta entonces? 
¿La de la conservación del registro o la constructivista? Dicho brevemente, 
ninguna de las dos. 


La investigación que acabo de describir se produjo al mismo tiempo que 
nuevos trabajos innovadores sobre las categorías y los conceptos. La 
categorización es una función básica de los seres vivos. Cada objeto es 
único, pero solemos actuar frente a objetos diferentes como miembros de 


clases o categorías. Aristóteles expuso los métodos por los que los 
científicos y filósofos modernos piensan sobre cómo se forman los 
conceptos en los seres humanos. Según él las categorías se derivan de listas 
de rasgos definitorios. Por ejemplo, tenemos en la mente una representación 
interna de la categoría «triángulo». Contiene una imagen mental o 
representación de cada triángulo que hemos visto a lo largo de nuestra vida, 
y podemos imaginar también nuevos triángulos. Lo que constituye en 
esencia esta categoría y lo que determina los límites de pertenencia 
categorial (lo que entra en ella y lo que queda fuera) es una definición que 
podría ser algo parecido a esto: «Un triángulo es una figura de tres lados». 
Si tuvieses formación matemática, tu definición podría ser más elaborada: 
«Un triángulo es una figura cerrada de tres lados, cuyos ángulos interiores 
suman 180 grados». Podrían añadirse a esta definición subcategorías de 
triángulos, como por ejemplo «un triángulo isósceles tiene dos lados de 
igual longitud; un triángulo equilátero tiene tres lados de la misma longitud; 
en un triángulo rectángulo, la suma de los cuadrados de los catetos es igual 
al cuadrado de la hipotenusa». 

Tenemos categorías para todos los tipos de cosas, vivas e inanimadas. 
Cuando se nos muestra algo nuevo (un triángulo nuevo, un perro que no 
hemos visto nunca) lo asignamos, según Aristóteles, a una categoría, 
basándonos en un análisis de sus propiedades y en una comparación con la 
definición categorial. Desde Aristóteles, pasando por Locke hasta hoy, se 
daba por supuesto que las categorías eran una cuestión de lógica, y los 
objetos estaban dentro o fuera de una categoría. 

Después de 2.300 años sin ningún trabajo sustancial sobre el tema, 
Ludwig Wittgenstein formuló una sencilla pregunta: ¿qué es un juego? Esto 
puso en marcha un renacimiento del trabajo empírico sobre la formación 
categorial. Entró aquí en escena Eleanor Rosch, que hizo su tesis de grado 
en filosofía en el Reed College de Portland, Oregón, con Wittgenstein. 
Había planeado durante años ir a una escuela de filosofía, pero un año con 
Wittgenstein, dice, «la curó» completamente de la filosofía. Considerando 
que la filosofía contemporánea se había metido en un callejón sin salida, se 
preguntó cómo podría estudiar ideas filosóficas empíricamente, cómo 
podría descubrir nuevos hechos filosóficos. Cuando yo estaba enseñando en 


la Universidad de California en Berkeley, donde ella es profesora, me 
explicó que creía que la filosofía había hecho todo lo que podía hacer 
respecto a los problemas del cerebro y de la mente, y que hacía falta 
experimentación para seguir avanzando. Hoy, siguiendo a Rosch, muchos 
psicólogos cognitivos consideran que una descripción válida de nuestro 
campo es «filosofía empírica»; es decir, plantear enfoques experimentales 
respecto a cuestiones y problemas que han pertenecido tradicionalmente al 
campo de los filósofos: ¿cuál es la naturaleza de la mente? ¿De dónde 
proceden los pensamientos? Rosch acabó en Harvard, y se doctoró allí en 
psicología cognitiva. Su tesis doctoral cambió nuestro modo de pensar 
sobre las categorías. 

Wittgenstein asestó el primer golpe a Aristóteles desbaratando la idea de 
definiciones estrictas de lo que es categoría. Utilizando la categoría 
«juegos» como ejemplo, alegó que no hay ninguna definición o serie de 
definiciones que puedan abarcar todos los juegos. Por ejemplo, podríamos 
decir que un juego a) se hace por diversión o recreo, b) es una actividad de 
ocio, c) es una actividad que se da con mayor frecuencia entre los niños, d) 
tiene ciertas reglas, e) es de algún modo competitivo, f) en él participan dos 
o más personas. Sin embargo, podemos mostrar contraejemplos para cada 
uno de estos elementos, que demuestran que las definiciones fallan: a) en 
las Olimpiadas, ¿están los atletas divirtiéndose?; b) ¿es el fútbol profesional 
una actividad de ocio?; c) el póker es un juego, como el frontón, pero no se 
da con mayor frecuencia entre niños; d) un niño tirando una pelota contra 
una pared está divirtiéndose, pero ¿cuáles son las reglas?; e) el corro no es 
competitivo; f) en un solitario no participan dos o más personas. ¿Cómo 
deshacernos de esta fe en las definiciones? ¿Hay alguna alternativa? 

Wittgenstein propuso que la pertenencia a una categoría no está 
determinada por una definición, sino por semejanza de familia. Llamamos a 
algo un juego si se parece a otras cosas que previamente hemos llamado 
juegos. Si asistiésemos a una reunión de la familia de Wittgenstein, 
podríamos ver que los miembros de la familia comparten ciertos rasgos, 
pero que no hay ningún rasgo físico único que uno deba tener de forma 
clara e imprescindible para pertenecer a ella. Un primo podría tener los ojos 
de tía Tessie; otro podría tener la barbilla de Wittgenstein. Algunos 


miembros de la familia tendrán la frente del abuelo, otros serán pelirrojos 
como la abuela. En vez de utilizar una lista estadística de definiciones, la 
similitud familiar se basa en una lista de rasgos que pueden o no estar 
presentes. La lista puede ser también dinámica; en determinado momento 
pueden desaparecer los pelirrojos de la estirpe familiar (si no media el tinte) 
y entonces nos limitamos a eliminarlo de nuestra lista de rasgos. Si surge de 
nuevo varias generaciones después, podemos reintroducirlo en nuestro 
sistema conceptual. Esta idea clarividente constituye la base de la teoría 
más convincente de la investigación contemporánea de la memoria, los 
modelos mnemotécnicos de huella múltiple en los que trabajó Douglas 
Hintzman y que ha retomado recientemente un brillante científico cognitivo 
llamado Stephen Goldinger, de Arizona. 

¿Podemos definir «música» mediante definiciones? ¿Y los tipos de 
música, como heavy metal, clásica o country? Esos intentos fracasarían sin 
duda igual que en el caso de los «juegos». Podríamos, por ejemplo, decir 
que heavy metal es un género musical que tiene a) guitarras eléctricas 
distorsionadas; b) batería fuerte y pesada; cC) tres acordes, o acordes 
eléctricos; d) cantantes sexys que normalmente no llevan camisa, chorrean 
sudor y blanden el pie del micrófono por el escenario como si fuese un 
trozo de cuerda, y e) diéresis en los nombres de los grupos. Pero esta lista 
estricta de definiciones es fácil de refutar aunque en la mayoría de las 
canciones heavy metal haya guitarras eléctricas distorsionadas, como 
sucede en «Beat It» de Michael Jackson. En realidad, Eddie Van Halen (el 
dios del heavy metal) toca el solo de guitarra en esa canción. Hasta los 
Carpenters tienen una canción con una guitarra distorsionada, y nadie les 
llamaría «heavy metal». Led Zeppelin (la banda de heavy metal 
quintaesencial, que se puede sostener que fue la que creó el género) tiene 
varias canciones en las que no hay ninguna guitarra distorsionada («Bron-y- 
aur», «Down by the Seaside», «Goin? to California», «The Battle of 
Nevermore»). «Stairway to Heaven» de Led Zeppelin es un himno heavy 
metal y no hay ninguna batería fuerte y pesada (ni guitarras distorsionadas 
en realidad) en el 90 por ciento. Tampoco tiene sólo tres acordes «Stairway 
to Heaven». Y muchísimas canciones tienen tres acordes y acordes 
eléctricos que no son heavy metal, incluidas la mayoría de las canciones de 


Raffi. Metallica es una banda de heavy metal sin duda, pero yo nunca he 
oído a nadie llamar sexy a su cantante principal, y aunque Mótley Crúe, 
Oyster Cult, Motórhead, Spinal Tap (con diéresis sobre la n) y Queensryche 
tienen diéresis gratuitas, muchas bandas de heavy metal no. Led Zeppelin, 
Metallica, Black Sabbath, Def Leppard, Ozzie Ousborne, Trumph, etc. Las 
definiciones de géneros musicales no son muy útiles; decimos que algo es 
heavy metal si parece heavy metal..., un parecido familiar. 

Rosch, armada con su conocimiento de Wittgenstein, decidió que algo 
puede ser más o menos miembro de una categoría; en vez de ser todo o 
nada como había creído Aristóteles, hay matices de pertenencia, grados de 
encaje en una categoría y matizaciones útiles. ¿Es un petirrojo un ave? La 
mayoría de la gente contestaría sí. ¿Es un pollo un ave? ¿Lo es un 
pingiiino? La mayoría de la gente diría sí tras una pequeña pausa, pero 
luego añadiría que los pollos y los pingiiinos no son muy buenos ejemplos 
de aves, ni típicos de la categoría. Esto se refleja en el lenguaje cotidiano 
cuando utilizamos salvaguardias lingúísticas como «Un pollo es 
“técnicamente” un ave», o «Sí, un pingúino es un ave, pero no vuela como 
la mayoría de las otras aves». Rosch, siguiendo a Wittgenstein, mostró que 
las categorías no siempre tienen fronteras claras: tienen fronteras borrosas. 
Las cuestiones de pertenencia son tema de debate y puede haber diferencias 
de opinión: ¿es el blanco un color? ¿Es realmente música el hip-hop? Si los 
miembros supervivientes de Queen actúan sin Freddie Mercury, ¿aún estoy 
viendo a los Queen (y merece la pena pagar ciento cincuenta dólares por 
una entrada)? Rosch demostró que la gente puede discrepar respecto a las 
categorizaciones (¿es un pepino una fruta o una hortaliza?) y que la misma 
persona puede discrepar incluso consigo misma en momentos diferentes 
respecto a una categoría (¿es fulano amigo mío?). 

El segundo descubrimiento de Rosch fue que todos los experimentos 
sobre categorías que se habían hecho antes de los suyos utilizaban 
conceptos y grupos de estímulos artificiales que tenían poco que ver con el 
mundo real. Y estos experimentos de laboratorio controlados estaban 
elaborados, de forma inadvertida, de tal modo que acababan siendo 
tendenciosamente favorables a las teorías de los experimentadores. Esto 
pone de relieve un problema permanente que afecta a toda la ciencia 


empírica: la tensión entre el control experimental riguroso y las situaciones 
del mundo real. El problema es que para ajustarse a uno de esos aspectos 
suele comprometerse el otro. El método científico exige que controlemos 
todas las variables posibles para poder extraer conclusiones firmes respecto 
al fenómeno que se estudia. Sin embargo, ese control crea a menudo 
estímulos o condiciones que nunca se hallarían en el mundo real, 
situaciones que están tan alejadas del mundo real que incluso podrían no ser 
válidas. El filósofo británico Alan Watts, autor de La sabiduría de la 
inseguridad, lo expresó así: si quieres estudiar un río, no cojas un cubo de 
agua de él y te pongas a mirarlo en la orilla. Un río no es agua, y al sacar el 
agua del río, pierdes la cualidad esencial del río, que es su movimiento, su 
actividad, su flujo. Rosch consideró que los científicos habían perturbado el 
flujo de las categorías al estudiarlas de una forma tan artificial. Eso, dicho 
sea de pasada, es un problema que se plantea también con gran parte de la 
investigación que se ha hecho en la neurociencia de la música en la última 
década: hubo demasiados científicos que estudiaron melodías artificiales 
utilizando sonidos artificiales, cosas tan alejadas de la música que no está 
claro lo que estamos aprendiendo. 

El tercer descubrimiento de Rosch fue que ciertos estímulos ocupan una 
posición privilegiada en nuestro sistema perceptivo o nuestro sistema 
conceptual, y que se convierten en prototipos de una categoría: las 
categorías se forman en torno a esos prototipos. En el caso de nuestro 
sistema perceptivo, categorías como «rojo» y «azul» son una consecuencia 
de nuestra fisiología retinal; ciertos matices del rojo serán considerados 
universalmente más vívidos, más centrales que otros debido a que una 
longitud de onda específica de la luz visible activará al máximo en su caso 
los receptores «rojos» de la retina. Formamos categorías en torno a esos 
colores centrales o focales. Rosch puso a prueba esa idea en una tribu de 
Nueva Guinea, los danis, que sólo tienen dos palabras en su idioma para los 
colores, mili y mola, que corresponden básicamente a claro y oscuro. 

Rosch quería demostrar que lo que llamamos rojo y lo que 
escogeríamos como un ejemplo del mejor rojo no es algo determinado o 
aprendido culturalmente. Cuando nos muestran un grupo de diferentes 
matices de rojo, no elegimos uno determinado porque nos hayan enseñado 


que es el mejor rojo, lo elegimos porque nuestra fisiología le otorga una 
posición perceptiva privilegiada. Los dani no tienen ninguna palabra para el 
rojo en su lengua, y por tanto ningún adiestramiento en lo que constituye un 
buen rojo frente a un mal rojo. Rosch mostró a sus sujetos danis fichas 
coloreadas con docenas de matices diferentes de rojo y les pidió que 
eligiesen el mejor ejemplo de ese color. Ellos seleccionaron 
abrumadoramente el mismo «rojo» que seleccionan los estadounidenses, y 
lo recordaban mejor. E hicieron eso con otros colores que no podía 
nombrar, como verdes y azules. Eso llevó a Rosch a la conclusión de que a) 
las categorías se forman en torno a prototipos; b) esos prototipos pueden 
tener un fundamento fisiológico o biológico; c) la pertenencia categorial 
puede concebirse como una cuestión de grado, siendo ciertas muestras 
«mejores» que otras; d) los elementos nuevos se juzgan en relación con los 
prototipos, formando gradientes de pertenencia categorial; y el golpe final a 
la teoría aristotélica, e) no hace falta que haya atributos que compartan 
todos los miembros de la categoría, y las fronteras no tienen por qué ser 
definidas. 

Hemos hecho algunos experimentos informales en mi laboratorio con 
géneros musicales y los resultados han sido similares. La gente parece estar 
de acuerdo en lo que son canciones prototípicas de categorías musicales, 
como por ejemplo «música country», «skate punk» y «música barroca». 
Tienden también a considerar ciertas canciones o ciertos grupos como 
ejemplos menos buenos que el prototipo: los Carpenters no son realmente 
música rock; Frank Sinatra no es «realmente» jazz, O al menos no tanto 
como lo es John Coltrane. Incluso dentro de la categoría de un solo artista, 
la gente establece distinciones de grado que entrañan una estructura 
prototípica. Si me pides que elija una canción de los Beatles y elijo 
«Revolution 9» (un fragmento experimental de John Lennon y Paul 
McCartney, sin ninguna música original, ni melodía ni ritmo, que empieza 
con un presentador repitiendo «Number 9, Number 9», una y otra vez) tú 
podrías quejarte de que lo estaba poniendo difícil. «Bueno, “técnicamente” 
es una pieza de los Beatles..., ¡pero yo no me refiero a eso!» Asimismo, un 
único álbum de doo-wop de Neil Young de los años cincuenta (Everybody's 
Rockin”) no es representativo (ni característico) de Neil Young; la incursión 


en el jazz de Joni Mitchell con Charles Mingus no es en lo que solemos 
pensar cuando pensamos en Joni Mitchell. (De hecho, sus respectivos sellos 
discográficos amenazaron con cancelar el contrato a Neil Young y a Joni 
Mitchell por hacer música que no se consideraba la propia de Neil Young y 
de Joni Mitchell.) 

Nuestra comprensión del mundo que nos rodea empieza con casos 
específicos e individuales (una persona, un árbol, una canción) y a través de 
la experiencia con el mundo, el cerebro trata casi siempre esos objetos 
particulares como miembros de una categoría. Roger Shepard ha descrito el 
sistema general de todo este análisis en términos evolucionistas. Hay tres 
problemas básicos de apariencia/realidad que, según él, todos los animales 
superiores tienen que resolver. Para sobrevivir, para encontrar alimento, 
agua, cobijo, para escapar a los predadores y para aparearse, el organismo 
debe tratar con tres escenarios. 

Primero, los objetos, aunque puedan parecer similares en su aspecto, 
son inherentemente distintos. Objetos que pueden crear pautas idénticas o 
Casi idénticas de estimulación en el tímpano, la retina, las papilas gustativas 
o los sensores táctiles pueden ser en realidad entidades distintas. La 
manzana que veo en el árbol es diferente de la que tengo en la mano. Los 
diferentes sonidos de violín que oigo en una sinfonía proceden de varios 
instrumentos distintos aunque estén tocando todos la misma nota. 

Segundo, los objetos, aunque puedan ser diferentes en apariencia, son 
en esencia idénticos. Cuando miramos una manzana desde arriba, o desde 
un lado, parece ser un objeto completamente distinto. La cognición efectiva 
exige un sistema computacional que pueda integrar esas visiones distintas 
en una representación coherente de un objeto único. Aunque los receptores 
sensoriales reciban pautas de activación diferenciadas y no superpuestas, 
necesitamos abstraer información decisiva para crear una representación 
unificada del objeto. Aunque yo pueda estar acostumbrado a oír tu voz en 
persona, a través de ambos oídos, cuando te oigo por teléfono, en un oído, 
necesito reconocer que eres la misma persona. 

El tercer problema de apariencia/realidad invocará procesos cognitivos 
de orden superior. Los dos primeros son procesos perceptivos: comprender 
que un objeto único puede manifestarse en marcos múltiples, o que varios 


objetos pueden tener marcos (casi) idénticos. El tercer problema consiste en 
que los objetos, aunque de aspecto diferente, son del mismo género natural. 
Esto es un problema en la categorización, y es el principio más convincente 
y avanzado de todos. Todos los mamíferos superiores, muchos mamíferos 
inferiores y aves, e incluso peces, pueden categorizar. La categorización 
entraña tratar objetos que parecen diferentes como del mismo tipo. Una 
manzana roja puede parecer diferente de una manzana verde, pero las dos 
siguen siendo manzanas. Mi madre y mi padre pueden parecer muy 
distintos, pero los dos son personas que se preocupan por mí y en las que se 
puede confiar en una emergencia. 

La conducta adaptativa se basa, pues, en un sistema computacional que 
puede analizar la información disponible en las superficies sensoriales 
según 1) las propiedades invariables del objeto o el escenario exterior, y 2) 
las circunstancias momentáneas de la manifestación de ese objeto o ese 
escenario. Leonard Meyer indica que esa clasificación es esencial para que 
compositores, intérpretes y oyentes puedan interiorizar las normas que rigen 
las relaciones musicales y, en consecuencia, para comprender las 
implicaciones de las pautas y las desviaciones de las normas estilísticas de 
la experiencia real. Como dice Shakespeare en El sueño de una noche de 
verano, nuestra necesidad de clasificar consiste en dar «a la nada etérea / 
una ubicación local y un nombre». 


La caracterización de Shepard reenfoca el problema de la categorización 
como un problema evolutivo/adaptativo. Rosch, por otra parte, estaba 
empezando a poner nerviosa con su trabajo a la comunidad investigadora, y 
docenas de destacados psicólogos cognitivos se dedicaron a buscar una 
forma de refutar su teoría. Posner y Keele habían demostrado que la gente 
almacena prototipos en la memoria. Habían realizado un ingenioso 
experimento utilizando muestras que contenían pautas de puntos colocados 
en un cuadrado, algo así como una de las caras de un dado, pero con los 
puntos situados más o menos al azar en cada cara. Los llamaron los 
prototipos. Luego cambiaron algunos de los puntos cerca de un milímetro 
en una dirección u otra, al azar. Eso creó una serie de distorsiones del 
prototipo (es decir, variaciones), que diferían en su relación con el 


prototipo. Algunos de los modelos, debido a variaciones al azar, no 
pudieron ser fácilmente identificados con un prototipo u otro, las presiones 
eran sencillamente demasiado grandes. 

Eso es lo que hace un músico de jazz con una canción muy conocida, o 
estándar. Cuando comparamos la versión de Frank Sinatra de «A Foggy 
Day» con la versión de Ella Fitzgerald y Louis Armstrong, oímos que 
algunos de los tonos y de los ritmos son los mismos y algunos son 
diferentes; esperamos que un buen vocalista interprete la melodía, aunque 
eso signifique cambiarla, no atenerse al modo en que la compuso 
originalmente su creador. En las cortes de Europa durante el barroco y 
durante la ilustración, músicos como Bach y Haydn realizaban de forma 
regular variaciones de temas. La versión de Aretha Franklin de «Respect» 
difiere de la escrita e interpretada por Otis Redding de diferentes modos..., 
pero seguimos considerándola la misma canción. ¿Qué dice esto sobre los 
prototipos y la naturaleza de las categorías? ¿Podemos decir que las 
variaciones musicales comparten un parecido familiar? ¿Son cada una de 
estas versiones de una canción variaciones de un prototipo ideal? 

Posner y Keele abordaron la cuestión general de las categorías y de los 
prototipos utilizando sus estímulos de puntos. Se mostraron a los sujetos 
trozos de papel con una versión tras otra de aquellos cuadrados con puntos, 
todos ellos diferentes entre sí, pero nunca los prototipos de los que se 
habían derivado las variaciones. No se les explicó cómo se habían 
construido aquellas pautas de puntos, ni que existían prototipos de aquellas 
formas diversas. Una semana más tarde, les pidieron que miraran más 
trozos de papel, algunos viejos y algunos nuevos, y que indicaran cuáles 
habían visto antes. Los sujetos identificaron muy bien los que habían visto 
antes y los que no habían visto. Ahora bien, los experimentadores, sin que 
los sujetos lo supiesen, habían incluido los prototipos a partir de los cuales 
habían creado todas las figuras. De forma asombrosa, los sujetos 
identificaron con frecuencia los dos prototipos que no habían visto 
previamente como figuras que habían visto antes. Esto proporcionó la base 
para sostener que los prototipos están almacenados en la memoria: ¿cómo 
podrían si no los sujetos haber identificado erróneamente las muestras que 
no habían visto? Para almacenar en la memoria algo que no se ha visto, el 


sistema mnemotécnico debe realizar algunas operaciones con los estímulos; 
tiene que haber una forma de procesar actuando en cada etapa que no se 
limita a preservar la información que se presenta. Esto parecía la muerte de 
cualquier teoría de conservación del registro; si los prototipos están 
almacenados en la memoria, la memoria tiene que ser constructiva. 

Lo que aprendimos de Ben White y del trabajo posterior de Jay 
Dowling de la Universidad de Texas y otros, es que la música es muy 
potente frente a las transformaciones y distorsiones de sus rasgos básicos. 
Podemos cambiar todos los tonos utilizados en la canción (transposición), el 
tempo y la instrumentación, y la canción sigue reconociéndose como la 
misma canción. Podemos cambiar los intervalos, las escalas, incluso la 
tonalidad de mayor a menor o viceversa. Podemos cambiar el arreglo (por 
ejemplo de bluegrass a rock, o de heavy metal a clásica) y, mientras se 
mantenga la letra de Led Zeppelin, la canción sigue siendo la misma. Yo he 
grabado a un grupo de bluegrass, Austin Lounge Lizards, tocando «Dark 
Side of the Moon» del grupo de rock progresivo Pink Floyd, utilizando 
bajos y mandolinas. Tengo grabaciones de la London Symphony Orchestra 
interpretando canciones de los Rolling Stones y de Yes. Pese a cambios tan 
espectaculares, la canción sigue siendo identificable. Parece, pues, que 
nuestro sistema mnemotécnico extrae alguna fórmula o descripción 
computacional que nos permite identificar canciones a pesar de esas 
transformaciones. La versión constructivista sería la que más se ajusta a los 
datos musicales, y según Posner y Keele, también a la cognición visual. 

En 1990 hice un curso en Stanford llamado «Psicoacústica y psicología 
cognitiva para músicos», que impartían conjuntamente los departamentos 
de música y de psicología. El curso lo daban en equipo un reparto completo 
de estrellas: John Chowning, Max Mathews, John Pierce, Roger Shepard y 
Perry Cook. Cada estudiante tenía que completar un proyecto de 
investigación, y Perry propuso que yo examinase lo bien que la gente podía 
recordar tonos, y concretamente si podían adjuntar etiquetas arbitrarias a 
esos tonos. Ese experimento uniría memoria y categorización. Las teorías 
predominantes predecían que no había ninguna razón para que la gente 
retuviese información de oído absoluto: el hecho de que se pudiesen 
reconocer con tanta facilidad melodías sometidas a transposición es un 


argumento a favor de eso. Y la mayoría de las personas no son capaces de 
nombrar las notas, sólo las que tienen oído absoluto, es decir, una entre diez 
mil. 

¿Por qué es tan raro el oído absoluto (OA)? La gente con OA puede 
nombrar las notas con la misma facilidad con que la mayoría de nosotros 
nombramos los colores. Si le tocas a alguien con OA un do sostenido al 
piano, puede decir que es un do sostenido. La mayoría de la gente no puede 
hacer eso, por supuesto..., ni siquiera lo pueden hacer la mayoría de los 
músicos, salvo que vean qué dedos utilizas. La mayoría de los que tienen 
OA pueden también identificar la altura de tono de otros sonidos, como las 
bocinas de los coches, el ronroneo de las luces fluorescentes y el tintineo de 
los cubiertos en el plato durante la comida. Como vimos antes, el color es 
una ficción psicofísica: no existe en el mundo, pero nuestros cerebros 
imponen una estructura categorial, como por ejemplo grandes muestras de 
rojo o azul, en el continuo unidimensional de frecuencia de las ondas 
luminosas. El tono es también una ficción psicofísica, la consecuencia de 
que nuestros cerebros impongan una estructura sobre el continuo 
unidimensional de frecuencia de las ondas sonoras. Podemos nombrar 
instantáneamente un color sólo con mirarlo. ¿Por qué no podemos nombrar 
los sonidos sólo con escucharlos? 

La mayoría podemos identificar sonidos con tan poco esfuerzo como 
identificamos colores; lo que sucede es simplemente que no es el tono lo 
que identificamos, sino el timbre. Podemos decir de inmediato de un 
sonido: «Eso es la bocina de un coche», o «Ésa es mi abuela Sadie que tiene 
catarro», O «Eso es una trompeta». Podemos identificar color tonal, pero no 
altura de tono. Aun así, queda sin resolver el problema de por qué algunas 
personas tienen OA y otras no. El difunto Dixon Ward, de la Universidad de 
Minnesota, comentó con ironía que la verdadera cuestión no es «¿Por qué 
sólo unas cuantas personas tienen OA?», sino «¿Por qué no lo tenemos 
todos?». 

Leí todo lo que pude sobre el OA. En los ciento treinta años 
transcurridos entre 1860 y 1990, se publicaron aproximadamente un 
centenar de artículos de investigación sobre el tema. ¡En los quince años 
transcurridos desde 1990 se han escrito un número igual de artículos! Me di 


cuenta de que todas las pruebas de OA exigían que los sujetos utilizasen un 
vocabulario especializado (los nombres de las notas) que sólo conocían los 
músicos. No parecía haber ningún modo de comprobar la existencia de oído 
absoluto entre los que no eran músicos. ¿O sí lo había? 

Perry propuso que investigásemos la facilidad con que el hombre de la 
Calle podía aprender a nombrar tonos asociando tonos determinados con 
nombres arbitrarios, como Fred o Ethel. Pensamos en utilizar notas de 
piano, diapasones y todo tipo de cosas (salvo kazoos, por razones obvias), y 
decidimos que entregaríamos diapasones a los que no eran músicos. Se les 
dijo luego que se golpearan con los diapasones en la rodilla varias veces al 
día durante una semana, reteniendo el sonido en el oído e intentando fijarlo 
en la memoria. A la mitad de los sujetos les dijimos que su sonido se 
llamaba Fred y a la otra mitad que se llamaba Ethel (por los vecinos de 
Lucy y Ricky en [ Love Lucy; su apellido era Mertz, que rima con Hertz, 
una grata coincidencia en la que no reparamos hasta años después). 

La mitad de cada grupo tenía diapasones afinados en doy, la otra mitad 
los tenía afinados en sol. Les dejamos actuar por su cuenta, luego les 
retiramos los diapasones una semana y después los hicimos volver al 
laboratorio. A la mitad de los sujetos se les pidió que cantasen «su tono» y a 
la otra mitad se les pidió que lo localizase en tres notas que yo toqué en un 
teclado. Los sujetos fueron abrumadoramente capaces de reproducir o 
reconocer «su» nota. La conclusión fue que la gente normal podía recordar 
notas con nombres arbitrarios. 

Esto nos llevó a pensar en el papel que desempeñan los nombres en la 
memoria. Aunque el curso había terminado y yo había entregado mi trabajo, 
seguíamos teniendo curiosidad por ese fenómeno. Roger Shepard preguntó 
si los que no eran músicos podrían ser capaces de recordar los tonos de las 
canciones aunque no supiesen los nombres. Yo le hablé de un estudio de 
Andrea Halpern. Ésta había pedido a gente de la calle que cantase de 
memoria canciones conocidas como «Happy Birthday» o «Frere Jacques» 
en dos ocasiones diferentes. Descubrió que aunque la gente tendía a no 
cantar con las mismas tonalidades, sí tendían a hacerlo de forma coherente, 
en la misma tonalidad en una ocasión que en la otra. Eso indicaba que 
tenían codificados los tonos de las canciones en la memoria a largo plazo. 


Los negativistas alegaron que esos resultados podían explicarse sin 
recuerdo del tono si los sujetos se habían limitado a basarse en la memoria 
muscular de la posición de sus cuerdas vocales de una vez a otra. (Para mí, 
la memoria muscular es aún una forma de memoria: etiquetar el fenómeno 
no sirve para cambiarlo.) Pero un estudio anterior de Ward y su colega Ed 
Burns, de la Universidad de Washington, había demostrado que la memoria 
muscular no es en realidad tan buena. Pidieron a cantantes con formación 
musical y con oído absoluto que «repentizaran» con una partitura musical; 
es decir, los cantantes tenían que leer una música que no habían visto nunca 
y Cantarla utilizando su conocimiento del oído absoluto y su capacidad para 
leer música. Se trata de algo que ellos hacen muy bien. Los cantantes 
profesionales pueden repentizar si les das un tono de partida. Sólo cantantes 
con oído absoluto pueden, sin embargo, cantar en la tonalidad justa sólo 
mirando la partitura; esto se debe a que tienen alguna plantilla interior, o 
recuerdo, de cómo los nombres de las notas y los sonidos casan entre sí: en 
eso consiste el oído absoluto. Ahora bien, Ward y Burns hicieron ponerse a 
sus cantantes con oído absoluto auriculares, y les atronaron con un ruido 
para que no pudiesen oír lo que estaban cantando: tenían que confiar sólo en 
la memoria muscular. El descubrimiento sorprendente fue que su memoria 
muscular no lo hacía demasiado bien. Sólo les llevaba, como media, hasta 
un tercio de octava del tono correcto. 

Sabíamos que los que no eran músicos tendían a cantar con coherencia. 
Pero queríamos llevar la idea más allá: ¿cuál es el grado de precisión de la 
memoria del individuo medio para la música? Halpern había elegido 
canciones muy conocidas que tienen una tonalidad «correcta»: cada vez que 
cantamos «Happy Birthday», probablemente lo hagamos en una totalidad 
diferente; alguien empieza con la que le viene primero a la cabeza y el resto 
le seguimos. Las canciones populares y de fiesta se cantan tan a menudo y 
las canta tanta gente que no tienen una tonalidad correcta objetivable. Esto 
se refleja en el hecho de que no hay ninguna grabación estándar que 
pudiésemos considerar como una referencia para esas canciones. En la jerga 
de mi campo, diríamos que no existe una versión canónica única. 

Con las canciones de rock y de pop sucede lo contrario. Canciones de 
los Rolling Stones, Police, Eagles y Billy Joel existen en una versión 


canónica única. Hay una grabación estándar (en la mayoría de los casos) y 
ésa es la única versión que uno ha oído siempre (con la excepción de la 
banda de bar esporádica que interpreta la canción, o el caso de que vayamos 
a ver un grupo en directo). Hemos oído probablemente esas canciones 
tantas veces como hemos oído «Deck the Halls». Pero cada vez que hemos 
oído, por ejemplo, «U Can't Touch This» de M. C. Hammer o «New Year?s 
Day» de U2 ha sido en la misma tonalidad. Es difícil recordar una versión 
distinta de la canónica. Después de oír una canción miles de veces, ¿podrían 
quedar codificados en la memoria los tonos concretos? 

Para estudiarlo, utilicé el método de Halpern de pedir simplemente a la 
gente que cantase sus canciones favoritas. Yo sabía por Ward y Burns que 
su memoria muscular no sería lo bastante buena para que lo hiciesen. Para 
reproducir la tonalidad correcta, tenían que retener en la cabeza huellas 
mnemotécnicas exactas y estables de los tonos. Recluté en el mismo 
campus a Cuarenta personas que no eran músicos y les pedí que fuesen al 
laboratorio y cantasen su canción favorita de memoria. Excluí canciones de 
las que había versiones múltiples, y aquellas que habían sido grabadas más 
de una vez, en más de una tonalidad. Me quedé con aquellas de las que hay 
una grabación única muy conocida que es la estándar, o referencia, 
canciones como «Time and Tide» de Basia o «Opposites Attract» de Paula 
Abdul (estábamos, después de todo, en 1990) y también canciones como 
«Like a Virgin» de Madonna y «New York State of Mind» de Billy Joel. 

Recluté a los sujetos del experimento con un vago anuncio de 
convocatoria para un «experimento de memoria». Los sujetos recibirían 
cinco dólares por diez minutos. (Así es como suelen conseguir sujetos para 
sus experimentos los psicólogos cognitivos, poniendo anuncios en el 
campus. Se paga más por los estudios de neuroimágenes del cerebro, 
normalmente en torno a los cincuenta dólares, sólo porque es un poco más 
desagradable estar confinado en un ruidoso escáner.) Muchos de los sujetos 
se quejaron y vociferaron al conocer los detalles del experimento. Ellos no 
eran cantantes, no sabían nada de música, tenían miedo a estropear mi 
experimento. Los convencí para que lo intentasen de todos modos. Los 
resultados fueron sorprendentes. En general tendieron a cantar con los tonos 


absolutos de sus canciones favoritas, o aproximarse mucho a ellos. Les pedí 
que cantaran una segunda canción y lo hicieron de nuevo. 

Aquello era una prueba convincente de que la gente almacenaba la 
información del tono absoluto en la memoria, que su representación 
mnemotécnica no sólo contenía una generalización abstracta de la canción, 
sino detalles de una interpretación determinada. Además de cantar con los 
tonos correctos, aparecían otros matices de la interpretación; en las 
reproducciones de los objetos había numerosos artificios vocales de los 
cantantes originales. Por ejemplo, reproducían el «ii-ii» agudo de Michael 
Jackson en «Billie Jean» o el «hey!» entusiasta de Madonna en «Like a 
Virgin»; la síncopa de Karen Carpenter en «Top of the World» así como la 
voz áspera de Bruce Springsteen en la primera palabra de «Born in the 
USA» Grabé una cinta que tenía las interpretaciones de los sujetos en un 
Canal de una señal estereofónica y la grabación original en el otro; sonaba 
como si los sujetos estuviesen acompañando a la grabación... pero no les 
habíamos puesto la grabación, estaban haciendo el acompañamiento con la 
representación mnemotécnica que tenían en la cabeza, y la representación 
era asombrosamente exacta. 

Perry y yo descubrimos también que la mayoría de los sujetos cantaban 
en el tempo correcto. Comprobamos que las canciones no se cantaban 
simplemente en el mismo tempo en principio, lo que significaría que la 
gente había grabado en la memoria sólo un tempo popular único. Pero no 
era así. Había una gama más grande de tempos. Además, en sus propias 
versiones subjetivas del experimento, los sujetos nos explicaron que estaban 
«cantando con una imagen» o «grabación» que tenían en la cabeza. ¿Cómo 
se compagina eso con una versión neuronal de los resultados del 
experimento? 

Yo estaba por entonces haciendo el postgrado con Mike Posner y Doug 
Hintzman. Posner, siempre al tanto de la plausibilidad neuronal, me habló 
del nuevo trabajo de Petr Janata, quien acababa de terminar un estudio en el 
que seguía el rastro de las ondas cerebrales de los sujetos mientras 
escuchaban o pensaban en música. Había utilizado electroencefalogramas, 
colocando sensores que medían la actividad eléctrica que emanaba del 
cerebro a través de la superficie del cuero cabelludo. Tanto Petr como yo 


nos quedamos sorprendidos al ver que era casi imposible diferenciar por los 
datos si la gente estaba escuchando música o imaginándola. La pauta de 
actividad cerebral era casi indiferenciable. Eso parecía indicar que la gente 
utilizaba las mismas regiones del cerebro para recordar que para percibir. 

¿Qué significa esto exactamente? Cuando percibimos algo, se activa un 
sector determinado de neuronas de un modo particular por un estímulo 
concreto. Aunque tanto oler una rosa como oler huevos podridos ponga en 
marcha el sistema olfativo, se utilizan circuitos neuronales diferentes. 
Recuerda que las neuronas pueden conectarse entre ellas de millones de 
modos distintos. Una configuración de un grupo de neuronas olfativas 
puede señalar «rosa» y otra puede señalar «huevos podridos». Para 
aumentar la complejidad del sistema, hasta las mismas neuronas pueden 
tener marcos diferentes asociados con un acontecimiento del mundo 
exterior diferente. Recordar puede ser simplemente el proceso de reclutar 
ese mismo grupo de neuronas que utilizamos durante la percepción para 
ayudarnos a formar una imagen mental durante el recuerdo. Convocamos a 
las neuronas, poniéndolas de nuevo en contacto desde sus ubicaciones 
dispares para que se conviertan en miembros del club original de neuronas 
que se activaron durante la percepción. 

Los mecanismos neuronales comunes que subyacen en la percepción de 
la música y su recuerdo ayudan a explicar cómo se nos pegan las canciones. 
Los científicos llaman a eso «gusanos del oído», del alemán Ohrwurm, o 
simplemente el síndrome de la canción pegadiza. Se ha hecho relativamente 
poco trabajo científico sobre el tema. Sabemos que es más probable que los 
músicos tengan ataques del gusano del oído que los que no lo son, y que es 
más probable que la gente con trastorno obsesivo-compulsivo (TOC) se 
queje de gusanos del oído...; en algunos casos la medicación que se utiliza 
para el TOC puede reducir al mínimo los efectos. Nuestra mejor explicación 
es que los circuitos neuronales que representan una canción quedan 
grabados en «modo playback», y la canción (o peor, un fragmento pequeño 
de ella) suena y suena una y otra vez. Las encuestas han revelado que raras 
veces es una canción entera la que se pega, es más bien un trozo que suele 
ser de menor o igual duración que la capacidad de la memoria auditiva a 
corto plazo («repercutiente» O «ecoica»): de quince a treinta segundos. Las 


canciones sencillas y los estribillos publicitarios son más pegadizos que las 
composiciones musicales complejas. Esta predilección por la simplicidad 
tiene una contrapartida en nuestra formación de la preferencia musical, que 
analizaremos en el capítulo 8. 

Los resultados de mi estudio de gente cantando sus canciones favoritas 
con el tempo y el tono exactos habían sido ratificados por otros 
laboratorios, así que sabíamos ya que no eran un simple resultado del azar. 
Glenn Schellenberg, en la Universidad de Toronto (un miembro original, 
dicho sea de pasada, del grupo New Wave Martha and the Muffins) realizó 
una ampliación de mi estudio en la que puso a los sujetos del experimento 
fragmentos de cuarenta canciones de gran éxito que duraban una décima de 
segundo, aproximadamente la misma duración que un chasqueo de dedos. 
Se entregó a los sujetos una lista de nombres de canciones y se les pidió que 
los asignasen a los fragmentos que oían. Con fragmentos tan breves, no 
podían apoyarse en la melodía ni en el ritmo para identificar las canciones: 
tenían en todos los casos menos de una o dos notas. Los sujetos sólo podían 
basarse en el timbre, el sonido global de la canción. En la introducción 
mencioné la importancia que tiene el timbre para compositores, autores de 
canciones y productores. Paul Simon piensa en función del timbre; es lo 
primero que escucha en su música y en la música de los demás. El timbre 
también parece tener esa posición privilegiada para el resto de nosotros; los 
sujetos que no eran músicos del estudio de Schellenberg fueron capaces de 
identificar las canciones utilizando sólo claves tímbricas en un porcentaje 
significativo. Incluso cuando se ponían los fragmentos al revés, 
desbaratando así cualquier cosa claramente familiar, seguían reconociendo 
las canciones. 

Si piensas en las canciones que conoces y que te gustan, eso debería 
tener algún sentido intuitivo. Prescindiendo del todo de la melodía, los 
tonos y ritmos específicos, algunas canciones simplemente tienen un sonido 
global, un color sónico. Es parecido a esa cualidad que hace que las llanuras 
parezcan de una manera, los bosques de otra, las montañas de otra diferente. 
Antes de identificar cualquier detalle en una foto de esos lugares, captas la 
escena global, el paisaje, el aspecto que tienen las cosas juntas. El paisaje 
auditivo, el entorno sonoro, tiene también una presentación que es única en 


gran parte de la música que oímos. A veces no es una canción específica. 
Eso es lo que nos permite identificar grupos musicales, aunque no podamos 
reconocer una canción concreta. Los primeros álbumes de los Beatles tienen 
una cualidad tímbrica especial, de manera que muchas personas pueden 
identificar una grabación de los Beatles aunque no reconozcan de inmediato 
la canción... incluso aunque se trate de una que no hayan oído nunca. Esa 
misma cualidad nos permite identificar imitaciones de los Beatles, cuando 
Eric Idle y sus colegas de Monty Python formaron el grupo ficticio de los 
Rutles como una banda satírica de los Beatles, por ejemplo. Al incorporar 
muchos de los elementos tímbricos distintivos del entorno sonoro de los 
Beatles, consiguieron crear una sátira realista que suena como los Beatles. 

Las presentaciones tímbricas globales, los entornos sonoros, pueden 
aplicarse también a períodos musicales enteros. Discos clásicos de la 
década iniciada en 1930 y de principios de los años cuarenta tienen un 
sonido particular propio debido a la tecnología de grabación de la época. El 
rock de los años ochenta, el heavy metal, la música de sala de baile de los 
años cuarenta y el rock and roll de finales de los años cincuenta son 
períodos o géneros bastante homogéneos. Los productores de discos pueden 
evocar esos sonidos en el estudio prestando atención detenida a detalles del 
entorno sonoro: los micrófonos que utilizaban, cómo mezclaban 
instrumentos, etc. Y muchos de nosotros podemos oír una canción y 
conjeturar con precisión a qué época pertenece. Una clave suele ser el eco, 
o reverberación, utilizado en la voz. Elvis Presley y Gene Vincent tenían un 
eco de «contraataque» muy distintivo, en el que oías una especie de 
repetición instantánea de la sílaba que acababa de cantar el vocalista. Se oye 
eso en «Be-Bop-A-Lula» de Gene Vincent y Rick Nelson, en «Heartbreak 
Hotel» de Elvis Presley y en «Instant Karma» de John Lennon. Luego está 
el eco cálido y rico que un local grande y azulejado aporta a las grabaciones 
de los Everly Brothers, como «Cathy?s Clown» y «Wake Up Little Susie». 
Hay muchos elementos distintivos en el timbre global de esas grabaciones 
que podemos identificar con el período en el que se hicieron. 

Los resultados obtenidos en los experimentos sobre el recuerdo de las 
canciones populares proporcionan, en conjunto, pruebas de que se codifican 
en la memoria rasgos absolutos de la música. Y no hay ninguna razón para 


pensar que la memoria musical funcione de forma distinta a, por ejemplo, la 
memoria visual, la olfativa, la táctil o la gustativa. Da la impresión, pues, de 
que la hipótesis de la conservación del registro tiene apoyo suficiente para 
que la adoptemos como un modelo del funcionamiento de la memoria. Pero 
antes de hacerlo, ¿qué podemos decir de las pruebas que apoyan la teoría 
constructivista? Si la gente puede identificar con tanta facilidad canciones 
sometidas a una transposición, tenemos que explicar cómo se almacena y 
abstrae esa información. Y hay un rasgo más de la música con el que todos 
estamos familiarizados, y que una teoría de la memoria adecuada necesita 
explicar: podemos repasar canciones con nuestro oído mental y podemos 
imaginar transformaciones de ellas. 

He aquí una demostración, basada en un experimento que realizó 
Andrea Halpern: ¿aparece la palabra at en el himno nacional 
estadounidense («The Star-Spangled Banner»)? Piensa antes de seguir 
leyendo. 

Si eres como la mayoría de la gente, «pasaste» la canción en tu cabeza, 
cantándola para ti a un ritmo rápido, hasta que llegaste a la frase «What so 
proudly we hailed, at the twilight's last gleaming». Ahora bien, hay aquí 
una serie de cosas interesantes. En primer lugar, probablemente cantaste la 
canción para ti mismo más deprisa de lo que nunca la has oído. Si sólo 
fueses capaz de repetir una versión determinada que tuvieses almacenada en 
la memoria, no podrías hacer eso. Segundo, tu memoria no es como una 
grabadora; si quieres acelerar una grabadora o un vídeo o una película para 
hacer que la canción vaya más deprisa, tienes que elevar también el tono. 
Pero en nuestra mente, podemos variar el tono y el tempo de forma 
independiente. Tercero, cuando llegaste por fin a la palabra at en tu mente 
(tu «objetivo» para contestar a la pregunta que yo formulé) probablemente 
no pudieses evitar seguir cantando el resto de la frase, «the twilight's last 
gleaming». Esto parece indicar que nuestro recuerdo de la música entraña 
una codificación jerárquica: mo todas las palabras son igual de 
sobresalientes, y no todas las partes de una frase musical gozan del mismo 
estatus. Tenemos ciertos puntos de entrada y de salida que corresponden a 
frases específicas de la música..., a diferencia, de nuevo, de una grabadora. 


Experimentos con músicos han confirmado esta idea de la codificación 
jerárquica de otros modos. La mayoría de los músicos no pueden empezar a 
interpretar una composición musical que conocen en cualquier ubicación 
arbitraria; los músicos aprenden música de acuerdo con una estructura de 
frase jerárquica. Grupos de notas forman unidades de práctica, estas 
unidades más pequeñas se agrupan en unidades más grandes, y después en 
frases; las frases se agrupan en estructuras como versos y Coros O 
movimientos, y finalmente se engarza todo como una composición musical. 
Pídele a un intérprete que empiece a tocar desde unas cuantas notas antes O 
después de un límite natural de frase, y no podrá hacerlo, ni siquiera 
leyendo una partitura. Otros experimentos han demostrado que los músicos 
son más rápidos y más exactos recordando dónde aparece una nota 
determinada en una pieza musical si esa nota está al principio de una frase o 
está en un primer tiempo que si está en mitad de la frase o en un tiempo 
débil. Hasta las notas musicales parecen distribuirse en categorías, según 
sean las notas «importantes» de una pieza o no. Muchos cantantes 
aficionados no guardan en la memoria todas las notas de una pieza musical. 
Lo que guardan son más bien las notas «importantes» (todos tenemos, 
aunque carezcamos de formación musical, un sentido intuitivo preciso de 
cuáles son esas notas) y el contorno musical. Luego, cuando llega la hora de 
cantar, el aficionado sabe que necesita ir de esta nota a aquélla, y añade 
sobre la marcha las que faltan, sin haber memorizado de manera explícita 
cada una de ellas. Esto reduce sustancialmente la carga mnemotécnica, y 
aumenta mucho la eficiencia. 

Todos estos fenómenos nos permiten ver que un proceso decisivo en la 
teoría de la memoria durante los últimos cien años fue su convergencia con 
la investigación sobre conceptos y categorías. Una cosa es segura ya: 
nuestra decisión sobre qué teoría de la memoria es correcta (la 
constructivista O la teoría de la conservación del registro/grabadora) tendrá 
implicaciones en las teorías de la categorización. Cuando oímos una nueva 
versión de nuestra canción favorita, nos damos cuenta de que se trata 
básicamente de la misma canción, incluso con una presentación diferente; el 
cerebro emplaza la nueva versión en una categoría entre cuyos miembros se 
incluyen todas las versiones de esa canción que hemos oído. 


Si somos verdaderos aficionados a la música, podríamos incluso 
desplazar un prototipo en favor de otro basándonos en conocimientos que 
obtenemos. Consideremos, por ejemplo, la canción «Twist and Shout». 
Podrías haberla oído innumerables veces interpretada por bandas en directo 
y en diversos bares y locales, y podrías también haber oído las grabaciones 
de los Beatles y The Mamas and The Papas. Una de estas dos últimas 
versiones podría ser incluso tu prototipo de la canción. Pero si yo te digo 
que los Isley Brothers tuvieron un gran éxito con la canción dos años antes 
de que la grabasen los Beatles, podrías reorganizar tu categoría para 
introducir esta nueva información. El que puedas realizar esa 
reorganización basada en un proceso de arriba abajo indica que hay algo 
más en las categorías de lo que afirma la teoría del prototipo de Rosch. La 
teoría del prototipo está estrechamente conectada con la teoría 
constructivista de la memoria, en que se desechan los datos de los casos 
individuales y se almacena el meollo o la generalización abstracta, tanto en 
el sentido de lo que se almacena como una huella mnemotécnica y lo que se 
almacena como el recuerdo central de la categoría. 

La versión de la memoria como conservación de registro tiene una 
correlación también en la teoría de la categorización, y se llama teoría del 
ejemplar. Pese a lo importante que era la teoría del prototipo y pese a que 
explicaba tanto nuestras intuiciones como los datos experimentales sobre la 
formación categorial, los científicos empezaron a tener problemas con ella 
en los años ochenta. Investigadores dirigidos por Edward Smith, Douglas 
Medin y Brian Ross identificaron algunos fallos en esa teoría. En primer 
lugar, cuando la categoría es amplia y sus miembros difieren mucho entre 
sí, ¿cómo puede haber un prototipo? Piensa por ejemplo en la categoría 
«herramienta». ¿Cuál es el prototipo? ¿O el de la categoría «mueble»? 
¿Cuál es la canción prototípica de un artista pop? 

Smith, Medin, Ross y sus colegas se dieron cuenta también de que 
dentro de estos tipos de categorías heterogéneas el contexto puede tener una 
gran influencia sobre lo que consideramos que es el prototipo. Es más 
probable que la herramienta prototípica en un garaje de reparación de 
automóviles sea una llave inglesa que un martillo, pero en una obra en 
construcción sería cierto lo contrario. ¿Cuál es el instrumento prototípico de 


una orquesta sinfónica? Estoy dispuesto a apostar que no has dicho 
«guitarra» ni «armónica», pero si hiciese la misma pregunta sobre un fuego 
de campamento dudo que dijeses «trompa» o «violín». 

La información contextual forma parte de lo que sabemos sobre 
categorías y miembros de categorías, y la teoría del prototipo no explica 
esto. Sabemos, por ejemplo, que dentro de la categoría «aves» las que 
cantan tienden a ser pequeñas. Dentro de la categoría «mis amigos» hay 
algunos a los que les dejaría mi coche y algunos a los que no se lo dejaría 
(en base a su historial de accidentes y a si tienen permiso de conducir o no). 
Dentro de la categoría «canciones de Fleetwood Mac», algunas las canta 
Christine McVie, algunas Lindsey Buckingham y algunas Stevie Nicks. 
Luego está lo que sabemos de los tres periodos diferenciados de Fleetwood 
Mac: los años del blues con Peter Green a la guitarra, los años intermedios 
pop con Danny Kirwan, Christine McVie y Bob Welch como autores de las 
canciones y los años posteriores, después de que se incorporaran 
Buckingham y Nicks. Si te pregunto por la canción prototípica de 
Fleetwood Mac, es importante el contexto. Si te pregunto por el miembro 
prototípico de Fleetwood Mac, levantarás las manos y me dirás que hay 
algo que no es correcto en la pregunta. Aunque Mick Fleetwood y John 
McVie, el tambor y el bajo, son los dos únicos miembros que han estado en 
el grupo desde el principio, no parece del todo exacto decir que el miembro 
prototípico es el tambor o el bajo, ninguno de los cuales canta ni escribió las 
canciones importantes. Compara esto con Police, del que podríamos decir 
que Sting era el miembro prototípico, como autor de canciones, cantante y 
bajo. Pero si alguien dijese eso, podrías tener buenas razones también para 
decir que se equivocaba, que Sting no es el miembro prototípico, es sólo el 
más conocido y más decisivo, que no es lo mismo. El trío que conocemos 
como Police es una categoría pequeña pero heterogénea, y hablar sobre un 
miembro prototípico no parece estar de acuerdo con el espíritu de lo que es 
un prototipo: la tendencia central, la media, el objeto visto o no visto que es 
el más característico de la categoría. Sting no es típico de Police en el 
sentido de ser alguna especie de media; es más bien atípico porque es 
muchísimo más conocido que los otros dos, Andy Summers y Stewart 
Copeland, y su historia desde Police ha seguido un curso muy distinto. 


Otro problema es que, aunque Rosch no afirma de forma explícita esto, 
sus categorías parecen tardar un tiempo en formarse. Aunque ella acepta 
explícitamente fronteras borrosas, y la posibilidad de que un objeto 
determinado pudiese ocupar más de una categoría («pollo» podría ocupar 
las categorías «ave», «volatería», «animales de corral» y «cosas para 
comer»), no hay una explicación clara del hecho de que seamos capaces de 
establecer nuevas categorías sobre la marcha. Y lo hacemos continuamente. 
El ejemplo más obvio es cuando elaboramos listas de audición para nuestro 
reproductor de MP3, o cargamos el coche con CD para escuchar en un largo 
viaje. La categoría «música que me apetece escuchar ahora» es sin duda 
alguna una categoría nueva y dinámica. O considera esto: ¿qué tienen en 
común las cosas siguientes: niños, cartera, mi perro, fotografías de familia y 
llaves del coche? Para muchas personas, éstas son «cosas para llevar 
conmigo en caso de incendio». Estas colecciones de cosas forman 
categorías ad hoc, y somos aficionados a hacerlas. Las formamos no a partir 
de la experiencia perceptiva con las cosas del mundo exterior, sino a partir 
de ejercicios conceptuales como los que hemos explicado. 

Podría formar otra categoría ad hoc con la siguiente historia: «Carol 
tiene problemas. Ha gastado todo su dinero y tardará tres días más en 
recibir un cheque. No hay comida en la casa». Esto conduce a la categoría 
funcional ad hoc «modos de conseguir comida para los tres próximos días», 
que podría incluir «ir a casa de una amiga», un «cheque sin fondos», «pedir 
dinero prestado a alguien», o «vender mi ejemplar de Tu cerebro y la 
música». Así que las categorías se forman no sólo agrupando propiedades, 
sino con teorías sobre cómo están relacionadas las cosas. Necesitamos una 
teoría de la formación categorial que explique a) categorías que no tienen 
ningún prototipo claro, b) información contextual, y c) el hecho de que 
formemos nuevas categorías continuamente, sobre la marcha. Para 
conseguir esto, da la impresión de que tenemos que haber retenido algo de 
la información original de los elementos incluidos, porque nunca sabes 
cuándo la necesitarás. Si (de acuerdo con los constructivistas) sólo estoy 
guardando información esencial abstracta y generalizada, ¿cómo podría 
construir una categoría como «canciones que tienen la palabra “amor” en la 
letra sin tenerla en el título»? Por ejemplo, «Here, There and Everywhere» 


(los Beatles), «Don't Fear the Reaper» (Blue Oyster Cult), «Something 
Stupid» (Frank y Nancy Sinatra), «Cheek to Cheek» (Ella Fitzgerald y 
Louis Armstrong), «Hello Trouble (Come On In)» (Buck Owens), «Can't 
You Hear Me Callin”» (Ricky Skaggs). 

La teoría del prototipo sugiere el punto de vista constructivista, que hay 
almacenada una generalización abstracta de los estímulos con los que nos 
enfrentamos. Smith y Medin propusieron la teoría del ejemplar como una 
alternativa. El rasgo característico de esta teoría es que cada experiencia, 
Cada palabra oída, cada beso que se da, cada objeto visto, O la canción que 
hemos escuchado alguna vez, está grabada como una huella en la memoria. 
Se trata del descendiente intelectual de la llamada teoría del residuo de la 
memoria propuesta por los psicólogos de la Gestalt. 

La teoría del ejemplar explica cómo somos capaces de retener tantos 
detalles con tanta exactitud. Según ella, detalles y contexto se retienen en el 
sistema conceptual de la memoria. Se considera algo miembro de una 
Categoría si recuerda a otros miembros de esa categoría más de lo que 
recuerda a miembros de una categoría alternativa rival. De forma indirecta, 
la teoría del ejemplar puede explicar también los experimentos que parecían 
indicar que hay prototipos almacenados en la memoria. Decidimos si algo 
es miembro de una categoría comparándolo con todos los demás miembros 
de la categoría: recuerdos de todo lo que encontramos que es un miembro 
de la categoría y cada vez que lo encontramos. Si se nos presenta un 
prototipo que no hemos visto antes (como en el experimento de Posner y 
Keele) lo categorizamos correcta y rápidamente porque tiene un máximo de 
semejanza con todos los otros ejemplos almacenados. El prototipo será 
similar a ejemplos de su propia categoría y no será similar a ejemplos de 
categorías alternativas, por eso te recuerda ejemplos de la categoría 
correcta. Hay más coincidencias que con ningún ejemplo visto previamente, 
por definición, porque el prototipo es la tendencia central, el miembro 
promedio de la categoría. Esto tiene importantes implicaciones en cómo 
llegamos a disfrutar de música nueva que nunca hemos oído, y cómo puede 
gustarnos de manera instantánea una canción nueva (el tema del capítulo 6). 

La convergencia de la teoría del ejemplar y la teoría de la memoria se 
produce en la forma de un grupo relativamente nuevo de teorías, 


denominadas de forma colectiva «modelos de huella múltiple de la 
memoria». En esta clase de modelos, cada experiencia que tenemos se 
preserva con gran fidelidad en nuestro sistema de memoria a largo plazo. Se 
producen confabulaciones y distorsiones de la memoria cuando, en el 
proceso de recuperar un recuerdo, bien chocamos con una interferencia de 
otras huellas que compiten por nuestra atención (huellas con detalles algo 
distintos) o algunos de los detalles de la huella mnemotécnica original se 
han degradado a causa de procesos neurobiológicos que se producen 
normalmente. 

La verdadera prueba de estos modelos es si pueden explicar y predecir 
los datos sobre prototipos, la memoria constructiva y la formación y 
retención de información abstracta, como por ejemplo cuando reconocemos 
una canción que ha sido sometida a una transposición. Podemos comprobar 
la plausibilidad neuronal de estos modelos a través de estudios de 
neuroimágenes. La directora de los laboratorios del cerebro del Instituto 
Nacional de Salud Estadounidense, Leslie Ungerleider, y sus colegas 
efectuaron estudios de MRIf en los que demostraron que las 
representaciones de categorías están ubicadas en partes específicas del 
cerebro. Rostros, animales, vehículos, alimentos, etc., se ha demostrado que 
ocupan regiones específicas del córtex. Y basándonos en estudios de 
lesiones, hemos encontrado pacientes que han perdido la capacidad de 
nombrar a miembros de algunas categorías, mientras que otras categorías 
permanecen intactas. Estos datos hablan de la realidad de la estructura 
conceptual y la memoria conceptual en el cerebro, pero ¿qué decir de la 
capacidad de almacenar información detallada y acabar pese a ello con un 
sistema neuronal que actúa como si hubiese almacenado abstracciones? 

En la ciencia cognitiva, cuando faltan los datos neurofisiológicos, 
suelen utilizarse para comprobar teorías modelos de redes neuronales. Se 
trata básicamente de simulaciones del cerebro en ordenadores, con modelos 
de neuronas, conexiones neuronales y activaciones neuronales. Los 
modelos reproducen la naturaleza paralela del cerebro, y por eso suele 
llamárseles modelos de procesamiento distribuido en paralelo o modelos 
PDP. David Rumelhardt, de Stanford, y Jay McClelland, de la Universidad 
Carnegie Mellon, ocuparon la primera línea en este tipo de investigación. 


No se trata de programas informáticos ordinarios. Los modelos PDP operan 
en paralelo (como los cerebros reales), tienen varias capas de unidades de 
procesamiento (como hacen las capas del córtex), las neuronas simuladas se 
pueden conectar de miles de formas distintas (como las neuronas reales) y 
las neuronas simuladas se pueden podar de la red o añadir a la red según sea 
necesario (al igual que el cerebro reconfigura redes neuronales cuando llega 
la nueva información). Pero dando problemas para resolver a los modelos 
PDP (como categorización O almacenamiento mnemotécnico y problemas 
de recuperación) podemos saber si la teoría en cuestión es plausible; si el 
modelo actúa del mismo modo que los seres humanos, aceptamos eso como 
prueba de que las cosas pueden funcionar también de ese modo en los seres 
humanos. 

Douglas Hintzman construyó el modelo PDP más influyente, y 
demostró la plausibilidad neuronal de los modelos de memoria de huella 
múltiple. Su modelo, denominado MINERVA por la diosa romana de la 
sabiduría, se creó en 1986. Almacenaba ejemplos individuales de los 
estímulos que recibía, y conseguía además producir el tipo de conducta que 
esperaríamos en un sistema que almacenase sólo prototipos y 
generalizaciones abstractas. Hacía eso de un modo muy parecido al que 
describen Smith y Medin, compartiendo los nuevos ejemplos con los 
almacenados. Stephen Goldinger descubrió más pruebas de que los modelos 
de huella múltiple pueden producir abstracciones con estímulos auditivos, 
específicamente con palabras dichas con voces específicas. 

Existe ya un consenso creciente entre los investigadores de la memoria 
en que ni el punto de vista de la conservación del registro ni el 
constructivista son correctos, sino que la teoría acertada es un tercer punto 
de vista, una especie de híbrido: el modelo de memoria de huella múltiple. 
Los experimentos sobre la exactitud del recuerdo de atributos musicales se 
corresponde con los modelos de huella múltiple de Hintzman/Goldinger. 
Éste es el modelo que más se parece al modelo de categorización del 
ejemplar, sobre el que hay también un consenso creciente. 

¿Cómo explica el modelo de memoria de huella múltiple el hecho de 
que extraigamos propiedades invariables de las melodías cuando las 
escuchamos? Cuando escuchamos una melodía, debemos de estar 


efectuando cálculos sobre ella, y además, para registrar los valores 
absolutos, los detalles de su presentación (detalles como tono, ritmo, tempo 
y timbre) debemos de estar calculando también intervalos melódicos e 
información rítmica libre de tempo. Los estudios de neuroimágenes de 
Robert Zatorre y sus colegas de McGill parecen indicar que esto es así. Los 
«centros de cálculo» melódico de los lóbulos temporales (superiores) 
dorsales (justo encima de tus oídos) parecen prestar atención al tamaño de 
los intervalos y a las distancias entre tonos cuando escuchamos música, 
creando una plantilla libre de tono de los valores modélicos precisos que 
necesitaremos para identificar las canciones si sufren una transposición. 
Mis propios estudios con neuroimágenes han mostrado que la música que 
conocemos activa estas regiones y el hipocampo, una estructura hundida en 
el centro del cerebro que sabemos que es crucial para el almacenamiento y 
la recuperación del recuerdo. Todos estos hallazgos juntos sugieren que 
almacenamos al mismo tiempo la información abstracta y la específica 
contenida en las melodías. Puede suceder lo mismo con todo tipo de 
estímulos sensoriales. 

Los modelos de memoria de huella múltiple, dado que preservan el 
contexto, pueden explicar también cómo recuperamos a veces recuerdos 
antiguos y casi olvidados. ¿No te ha sucedido nunca ir andando por la calle 
y percibir de pronto un olor que hacía muchísimo que no percibías, y que 
eso desencadene un recuerdo de un acontecimiento de hace mucho tiempo? 
¿O no has oído una vieja canción en la radio que te remite de inmediato a 
recuerdos profundamente enterrados relacionados con la época en que esa 
canción fue popular por primera vez? Estos fenómenos apuntan a la esencia 
de lo que significa tener recuerdos. La mayoría de nosotros tenemos un 
conjunto de recuerdos que tratamos de una forma parecida a un álbum de 
fotos o de recortes de prensa. Hay ciertas historias que solemos contar a los 
amigos y a la familia, otras experiencias del pasado nos las recordamos a 
nosotros mismos en periodos de lucha, de tristeza, alegría o tensión, para no 
olvidar quiénes somos y dónde hemos estado. Podemos concebir esto como 
el repertorio de los recuerdos, aquellos recuerdos que estamos 
acostumbrados a evocar, algo así como el repertorio de un músico y las 
piezas que sabe tocar. 


De acuerdo con esos modelos de huella múltiple, cada experiencia está 
potencialmente grabada en la memoria. No en un lugar determinado del 
cerebro, porque el cerebro no es como un almacén; los recuerdos están más 
bien codificados en grupos de neuronas que, cuando se ajustan a los valores 
adecuados y configurados de un modo particular, harán que un recuerdo se 
recupere y vuelva a representarse en el teatro de nuestra mente. La barrera 
que impide que seamos capaces de recordar todo lo que podríamos querer 
recordar no es, por tanto, que no esté «almacenado» en la memoria; el 
problema es más bien hallar la clave correcta para acceder a ella y 
configurar de forma adecuada los circuitos neuronales. Cuanto más 
accedamos a la memoria, más activos se vuelven los circuitos de 
recuperación y recuerdo, y más fácil nos será dar con las claves necesarias 
para conseguir un recuerdo. En teoría, podríamos acceder a cualquier 
experiencia del pasado sólo con que tuviésemos las claves correctas. 

Piensa por un momento en tu profesor de tercer curso: eso 
probablemente sea algo en lo que no has pensado en mucho tiempo, pero 
ahí está, un recuerdo instantáneo. Si siguieses pensando en tu profesor, en tu 
clase, podrías ser capaz de recordar algunas cosas más sobre el tercer curso, 
como los pupitres del aula, los pasillos del colegio, los compañeros de 
juegos. Estas claves son bastante genéricas y algo imprecisas. Sin embargo, 
si te enseñara una foto de tu clase de tercer curso, podrías empezar a 
recordar de pronto todo tipo de cosas que habías olvidado: los nombres de 
tus compañeros de clase, las asignaturas que estudiabas, los juegos a los que 
jugabas en el recreo. Una canción incluye un conjunto muy específico y 
vívido de claves mnemotécnicas. Dado que los modelos de memoria de 
huella múltiple consideran que el contexto está codificado junto con las 
huellas mnemotécnicas, la música que has escuchado en los diversos 
períodos de tu vida está entremezclada con los acontecimientos codificados 
de esos períodos. Es decir, la música está vinculada a los acontecimientos 
de la época, y esos acontecimientos están vinculados a la música. 

Una máxima de la teoría de la memoria es que las claves únicas son las 
más eficaces para despertar recuerdos; con cuantos más elementos o más 
contextos esté asociada una clave determinada, menos eficaz será para 
recuperar un recuerdo determinado. Por eso, aunque ciertas canciones se 


podrán asociar con ciertos períodos de tu vida, no son claves muy eficaces 
para recuperar recuerdos de esos períodos si las canciones han seguido 
interpretándose y estás habituado a oírlas, como sucede a menudo con 
emisoras de rock clásico o las estaciones de radio clásicas que se basan en 
un repertorio un tanto limitado de composiciones clásicas «populares». Pero 
cuando oímos una canción que no hemos escuchado desde una época 
determinada de nuestras vidas, se abren las compuertas de la memoria y nos 
vemos inundados de recuerdos. La canción ha actuado como una clave 
única, una llave que abre todas las experiencias asociadas con el recuerdo 
de la canción, su época y su lugar. Y como la memoria y la categorización 
están vinculadas, una canción puede dar acceso no sólo a recuerdos 
específicos, sino a recuerdos categoriales más amplios. Por esa razón, si 
oyeses una canción de discoteca de la década de los setenta («YMCA» de 
Village People, por ejemplo) podrías encontrarte con que sonaban en tu 
Cabeza otras canciones de ese tipo, como por ejemplo «I Love the 
Nightlife» de Alicia Bridges y «The Hustle» de Van McCoy. 

La memoria afecta a la experiencia de escuchar música tan 
profundamente que no sería hiperbólico decir que sin memoria no habría 
música. Como han indicado numerosos teóricos y filósofos, así como el 
autor de canciones John Hartford en su canción «Tryin* to Do Something to 
Get Your Attention», la música se basa en la repetición. La música opera 
porque recordamos los tonos que acabamos de oír y los relacionamos con 
los que se están oyendo justo ahora. Esos grupos de tonos (frases) podrían 
aparecer más tarde en la pieza en una variación o transposición que 
cosquillee nuestro sistema de memoria y active al mismo tiempo nuestros 
centros emotivos. En los últimos seis años, los neurocientíficos han 
mostrado hasta qué punto está íntimamente relacionado nuestro sistema de 
memoria con nuestro sistema emocional. La amígdala, considerada durante 
mucho tiempo la sede de las emociones en los mamíferos, está situada junto 
al hipocampo, considerado desde hace mucho tiempo la estructura crucial 
para el almacenamiento del recuerdo, e incluso para su recuperación. Ahora 
sabemos que participa también en la memoria; en concreto, cualquier 
experiencia o recuerdo que tenga un fuerte componente emotivo la activa en 
sumo grado. “Todos los estudios con neuroimágenes que ha hecho mi 


laboratorio han demostrado la activación de la amígdala por la música, pero 
no por agrupaciones aleatorias de sonidos o notas musicales. Cuando un 
gran compositor efectúa con destreza la repetición, es emotivamente 
satisfactoria para el cerebro, y hace que la experiencia de la audición sea tan 
grata. 
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DESPUÉS DEL POSTRE, CRICK ESTABA AÚN A CUATRO 
ASIENTOS DE MÍ 


MÚSICA, EMOCIÓN Y EL CEREBRO REPTIL 


Como he analizado ya, la mayoría de la música es música de zapateo. 
Escuchamos música que tiene una cadencia, un ritmo, algo que puedes 
seguir con el pie, o al menos seguir con el pie mentalmente. Este ritmo, con 
escasas excepciones, se extiende de una forma regular y equilibrada en el 
tiempo. El ritmo regular nos hace esperar que ocurran acontecimientos en 
determinados puntos a lo largo del tiempo. Como el traqueteo de la vía del 
tren, nos permite saber que seguimos yendo hacia delante, que estamos en 
movimiento, que todo va bien. 

Los compositores suspenden a veces este sentido del ritmo, como en los 
primeros compases de la Quinta Sinfonía de Beethoven. Oímos «bump- 
bump-bump-baaaah» y la música cesa. No estamos seguros de cuándo 
vamos a volver a oír un sonido. El compositor repite la frase (utilizando 
tonos distintos) pero después de ese segundo silencio estamos ya en 
marcha, con un compás regular zapateable. Otras veces, los compositores 
nos dan explícitamente esa cadencia o ritmo, pero luego suavizan de forma 
intencionada su presentación antes de introducir una expresión fuerte de él 
para conseguir un efecto espectacular. «Honky 'Tonk Women» de los 
Rolling Stones comienza con cencerro, seguido de batería, seguida de 
guitarra eléctrica; se mantiene el mismo compás y también nuestro sentido 
del ritmo, pero se amplía la intensidad de los tiempos fuertes. (Y si 
escuchamos con auriculares el cencerro llega sólo por un oído, con un 


efecto más espectacular.) Esto es característico de los himnos de rock y de 
heavy metal. «Back in Black» de AC/DC empieza con los acordes de 
platillos de pedal y guitarra apagada que suenan casi como una pequeña 
Caja clara ocho tiempos hasta que se produce el ataque de la guitarra 
eléctrica. Jimi Hendrix hace lo mismo al principio de «Purple Haze»: ocho 
corcheas en la guitarra y el bajo, notas solas que nos marcan explícitamente 
el compás antes de que entre la batería atronadora de Mitch Mitchell. A 
veces los compositores nos hacen rabiar, creando expectativas con compás 
y traicionándolas luego para asentarse en algo fuerte: una especie de broma 
musical que nos gastan. «Golden Lady» de Stevie Wonder y «Hypnotized» 
de Fleetwood Mac establecen un compás que cambia cuando entran el resto 
de los instrumentos. Frank Zappa era un maestro en eso. 

Algunos tipos de música parecen más rítmicamente dirigidos que otros, 
por supuesto. Aunque «Eine Kleine Nachtmusic» y «Stayin” Alive» tienen 
ambos un compás definible, el segundo es probable que haga que la 
mayoría de la gente se levante y baile (al menos eso es lo que nos pasaba en 
la década de los setenta). El que la música tenga un tiempo fácilmente 
predecible ayuda mucho a que nos conmueva (física y emotivamente). Los 
compositores consiguen esto subdividiendo de diferentes modos el compás, 
y acentuando algunas notas de una forma distinta que otras; en gran medida 
se relaciona también con la interpretación. Cuando hablamos de un gran 
groove en música, no estamos hablando en algún argot fabuloso de los años 
sesenta a lo Austin Powers; estamos hablando de en qué modo esas 
divisiones del compás crean un fuerte impulso. Groove es esa cualidad que 
mueve la canción hacia delante, el equivalente musical a un libro que no 
puedes dejar. Cuando una canción tiene un buen groove, nos invita a un 
mundo sónico que no queremos dejar. Aunque tenemos conciencia de la 
Cadencia de la canción, el tiempo externo parece inmovilizarse y no 
queremos que la canción acabe nunca. 

Groove se relaciona con un intérprete determinado o una actuación 
determinada, no con lo que está escrito en el papel. Puede ser un aspecto 
sutil de la actuación que viene y se va de un día para otro, incluso con el 
mismo grupo de músicos. Y, por supuesto, los oyentes discrepan respecto a 
si algo tiene un buen groove o no lo tiene, pero para establecer cierta base 


común aquí sobre el tema, la mayoría de la gente piensa que «Shout» de los 
Isley Brothers y «Super Freak» de Rick James tienen un gran groove, lo 
mismo que «Sledgehammer» de Peter Gabriel. «I'm On Fire» de Bruce 
Springsteen, «Superstition» de Stevie Wonder y «Ohio» de los Pretenders 
tienen todos gran groove y son muy diferentes entre sí. Pero no hay ninguna 
fórmula que indique cómo crear uno grande, como te dirán todos los 
músicos de ReB que han intentado copiar el groove de melodías clásicas 
como las de Temptations y Ray Charles. El hecho de que podamos señalar 
relativamente pocas canciones que lo tengan demuestra que no es fácil 
copiarlo. 

Un elemento que da a «Superstition» su gran groove es la batería de 
Stevie Wonder. En los primeros segundos iniciales en que los platillos de 
pedal de Stevie tocan solos, puedes oír parte del secreto del groove de la 
canción. Los baterías consideran los platillos de pedal su cronometrador. 
Aunque los oyentes no los puedan oír en un pasaje fuerte, el batería los 
utiliza como punto de referencia. El tiempo que toca Stevie en los platillos 
nunca es exactamente el mismo; mezcla en él pequeños toques, golpes y 
silencios. Además, cada nota que él toca en los platillos tiene un volumen 
algo distinto, matices interpretativos que aumentan la sensación de tensión. 
La caja clara empieza con bum-(silencio)-bum-bum-pa y entramos en la 
pauta de los platillos: 


DOOT-doot-doot-dootah DOOtah-doot-doot-dootah 
DOOT-daat-doot-dootah DOOT-dootah-dootah-doot 


El talento con el que toca es lo que nos mantiene mentalmente de puntillas 
esperando los aspectos cambiantes de la pauta cada vez que la toca, 
manteniendo justo lo suficiente de ella igual para que no perdamos pie y 
podamos orientarnos. Aquí, toca al mismo ritmo al principio de cada línea, 
pero lo cambia en la segunda parte de ella, en una pauta de «llamada y 
respuesta». Utiliza también su habilidad como batería para alterar el timbre 
de los platillos en un punto clave: en la segunda nota de la segunda línea, en 
la que ha mantenido el ritmo igual, toca los platillos de una forma distinta 


para hacerlos «hablar» con una voz diferenciada; si sus platillos fuesen una 
vOz, es como si cambiase el sonido vocálico que estuviese usando. 

Los músicos están de acuerdo en general en que el groove es mejor 
cuando no es de forma estricta metronómico..., es decir, cuando no es de 
una perfección maquinal. Aunque algunas canciones bailables se han hecho 
con cajas de ritmos («Billie Jean» de Michael Jackson y «Straight Up» de 
Paula Abdul, por ejemplo), el patrón oro del groove es en general un batería 
que cambia el tempo ligeramente de acuerdo con matices estéticos y 
emotivos de la música; decimos entonces que el tema rítmico, que el bajo, 
«respira». Steely Dan pasó meses intentando corregir, recorregir, cambiar, 
meter y sacar las partes de caja de ritmos de su álbum Two Against Nature 
con el fin de conseguir que sonaran como si las hubiese tocado un ser 
humano, para equilibrar el groove con respiración. Pero al cambiar tempos 
locales, y no globales, no cambia el compás, la estructura básica del tiempo; 
sólo cambia el momento preciso en que se producirán los tiempos, no si se 
agrupan en doses, treses o cuatros, y no el ritmo global de la canción. 

No solemos hablar de groove en el contexto de la música clásica, pero la 
mayoría de las óperas, sinfonías, sonatas, conciertos y cuartetos de cuerda 
tienen un compás y una cadencia definibles, que se corresponden 
generalmente con los movimientos del director; el director muestra a los 
músicos dónde están los tiempos, estirándolos a veces o comprimiéndolos 
para comunicar de forma emotiva. Las conversaciones reales entre 
personas, las súplicas reales de perdón, las expresiones de cólera, el 
galanteo, la narración de cuentos, la planificación y la crianza no se 
producen con los ritmos precisos de una máquina. La música, en la medida 
en que refleja la dinámica de nuestra vida emocional, y nuestras 
interacciones interpersonales, necesita hincharse y contraerse, acelerarse y 
aminorarse, detenerse y reflejar. El único medio que tenemos de poder 
sentir o conocer esas variaciones de ritmo es si un sistema computacional 
del cerebro ha extraído información sobre cuándo se supone que deben 
producirse los tiempos. El cerebro necesita crear un modelo de ritmo 
constante (un esquema) para que sepamos cuándo los músicos se están 
desviando de él. Esto es similar a las variaciones de una melodía: 


necesitamos tener una representación mental de lo que es la melodía para 
conocer (y apreciar) cuándo se está tomando libertades el músico con ella. 

La extracción métrica, sabiendo lo que es el tiempo y cuándo esperamos 
que se produzca, es una parte crucial de la emoción en música. La música 
nos comunica emotivamente a través de violaciones sistemáticas de 
expectativas. Estas violaciones pueden producirse en cualquier campo: el de 
la altura del tono, el timbre, el contorno, el ritmo, el tempo, etc., pero tienen 
que producirse. La música es sonido organizado, pero la organización tiene 
que incluir algún elemento inesperado porque si no es plana y robótica. Una 
organización excesiva puede aún ser técnicamente música, pero sería 
música que nadie querría escuchar. Las escalas, por ejemplo, están 
organizadas, pero la mayoría de los padres se hartan de ofírselas tocar a sus 
hijos al cabo de cinco minutos. 

¿Qué decir de la base neuronal de esta extracción métrica? Por estudios 
de lesiones cerebrales sabemos que el ritmo y la extracción métrica no están 
neuronalmente relacionados entre sí. Pacientes con el hemisferio izquierdo 
lesionado pueden perder la capacidad de percibir y producir ritmo, pero 
pueden aún extraer el compás, y pacientes con el hemisferio derecho 
lesionado han mostrado la pauta opuesta. Ambas cosas están neuronalmente 
separadas del procesamiento melódico: Robert Zatorre descubrió que las 
lesiones en el lóbulo temporal derecho afectan a la percepción de melodías 
más que las lesiones en el izquierdo. Isabelle Peretz descubrió que el 
hemisferio derecho del cerebro contiene un procesador de contorno que 
dibuja en realidad un perfil de una melodía y lo analiza para su posterior 
reconocimiento, y esto es disociable de los circuitos cerebrales del ritmo y 
del compás. 

Como vimos en el caso de la memoria, los modelos de ordenador 
pueden ayudarnos a captar el funcionamiento del interior del cerebro. Peter 
Desain y Henkjan Honing, de Holanda, elaboraron un modelo informático 
Capaz de extraer el tiempo de una pieza de música. Se basaba 
principalmente en la amplitud, el hecho de que el compás esté definido por 
ritmos fuertes frente a ritmos suaves que se producen a intervalos regulares 
de alternancia. Para demostrar la eficacia de su sistema (y porque 
reconocían el valor de la teatralidad, incluso en ciencia) conectaron la 


producción de su sistema a un pequeño motor eléctrico instalado dentro de 
un zapato. Su demostración de extracción de tiempo hizo zapatear 
realmente su pie (o al menos un Zapato unido a una varilla metálica) de 
acuerdo con piezas reales de música. Yo vi esa demostración en el Centro 
de Investigación de Música y Acústica por Ordenador a mediados de la 
década de los noventa. Era muy impresionante. Los espectadores (los llamo 
así porque la visión de un zapato de caballero negro de vestir del cuarenta y 
dos colgando de una varilla metálica y conectado a través de una culebra de 
cables al ordenador era todo un espectáculo) pudieron dar un CD a Desain y 
Honing y su zapato, al cabo de unos segundos de «escuchar», empezaba a 
zapatear sobre un trozo de contrachapado. (Cuando terminó la 
demostración, Perry Cook se acercó a ellos y les dijo: «Un excelente 
trabajo, pero ¿funciona con los de color marrón?») 

Curiosamente, el sistema de Desain y Honing tenía parte de las mismas 
debilidades que tienen los humanos vivos reales: zapateaba a veces a medio 
compás o a doble, en lugares parecidos a donde lo hacían los músicos 
profesionales. Los aficionados hacen esto continuamente. Cuando un 
modelo computarizado comete errores similares a un humano, es una 
prueba aún mejor de que nuestro programa está reproduciendo el 
pensamiento humano, o al menos los tipos de procesos computacionales 
que subyacen al pensamiento. 

El cerebelo es la parte del cerebro que está estrechamente relacionada 
con la sincronización y la coordinación de movimientos del cuerpo. La 
palabra «cerebelo» procede del latín cerebellum, que significa «pequeño 
cerebro», y parece realmente un pequeño cerebro colgando debajo del otro 
(el mayor, la parte principal del cerebro), justo en la parte de atrás del 
cuello. El cerebelo tiene dos lados, como el cerebro, y cada uno de ellos 
está dividido en subregiones. Sabemos por los estudios filogenéticos 
(estudios de los cerebros de diversos animales a lo largo de la escala 
genética) que el cerebelo es una de las partes más antiguas del cerebro 
desde el punto de vista de la evolución. Aunque sólo pese un diez por ciento 
contiene del cincuenta al ochenta por ciento del número total de neuronas. 
La función de esta parte más antigua del cerebro es algo crucial para la 
música: la sincronización. 


El cerebelo ha sido considerado tradicionalmente como la parte del 
cerebro que guía el movimiento. La mayoría de los movimientos de la 
mayoría de los animales tienen un carácter repetitivo y oscilatorio. Cuando 
caminamos o corremos, tendemos a hacerlo a un ritmo más o menos 
constante; el cuerpo se asienta en un paso y lo mantenemos. Cuando los 
peces nadan o las aves vuelan, tienden a mover las aletas o a aletear a un 
ritmo más o menos constante. El cerebelo participa en el mantenimiento de 
ese ritmo, o paso. Una de las características de la enfermedad de Parkinson 
es la dificultad para caminar, y ahora sabemos que esa enfermedad va 
acompañada de degeneración cerebelar. 

Pero ¿qué decir de la música y el cerebelo? En mi laboratorio 
localizamos fuertes activaciones en el cerebelo cuando pedimos a la gente 
que escuchase música, pero no cuando les pedimos que escuchasen ruido. 
El cerebelo parece participar en el seguimiento del ritmo. Y el cerebelo ha 
aparecido en nuestros estudios en otro contexto: cuando pedimos a la gente 
que escuchase música que les gustase y luego música que no les gustase, o 
música con la que estuviesen familiarizados y música desconocida. 

Muchas personas, incluidos nosotros, se preguntaban si esas 
activaciones cerebrales correspondientes al gusto y la familiaridad estaban 
equivocadas. Luego, en el verano de 2003, Vinod Menon me habló del 
trabajo del profesor de Harvard Jeremy Schmahmann. Éste había estado 
nadando a contracorriente frente a la oleada de tradicionalistas que decían 
que la función del cerebelo se limita a la sincronización y el movimiento. 
Pero él y sus colaboradores, a través de autopsias, neuroimágenes, estudios 
de casos y estudios de otras especies, habían reunido pruebas persuasivas de 
que el cerebelo participaba en la emoción. Eso aclararía por qué se activaba 
cuando la gente oía música que le gustaba. Él explica que el cerebelo 
contiene importantes conexiones con centros emotivos del cerebro: la 
amígdala, que participa en el recuerdo de acontecimientos emotivos, y el 
lóbulo frontal, la parte del cerebro que participa en la planificación y el 
control del impulso. ¿Cuál es la conexión entre emoción y movimiento, y 
por qué han de participar en ambos la misma región del cerebro, una región 
que encontramos incluso en serpientes y lagartos? No lo sabemos seguro, 
pero hay algunas conjeturas bien fundadas que proceden de la mejor de las 


fuentes: los descubridores de la estructura del ADN, James Watson y 
Francis Crick. 


El Laboratorio de Cold Spring Harbor es una institución avanzada de alta 
tecnología de Long Island, especializada en la investigación sobre 
neurociencia, neurobiología, cáncer y (como corresponde a una institución 
cuyo director es el premio Nobel James Watson) genética. A través de 
Stony Brook de la SUNY, ese laboratorio ofrece graduaciones y formación 
avanzada en esos campos. Una colega mía, Amandine Penel, fue docente 
posdoctoral allí un par de años. Se había doctorado en cognición musical en 
París mientras yo estaba haciéndolo en la Universidad de Oregón; nos 
conocíamos de las conferencias anuales sobre cognición musical. El 
laboratorio de Cold Spring Harbor organiza con esa periodicidad un taller, 
una reunión intensiva de científicos que son especialistas en un tema 
concreto. Esos talleres duran varios días; todo el mundo come y duerme en 
el laboratorio y se pasa el día entero discutiendo el problema científico 
elegido. La idea que hay detrás de una reunión de ese género es que si los 
que son especialistas mundiales en el tema (y que mantienen a menudo 
puntos de vista Opuestos y enfrentados) pueden llegar a algún tipo de 
acuerdo sobre ciertos aspectos del problema, la ciencia puede avanzar más 
rápido. Esos talleres son famosos en genómica, genética de las plantas y 
neurobiología. 

Me llevé una sorpresa un día que, enterrado entre mensajes electrónicos 
bastante mundanos sobre los programas del examen final y el comité 
curricular de pregraduados en McGill, vi uno que me invitaba a participar 
en un taller de cuatro días en Cold Spring Harbor. He aquí lo que decía: 


Pautas de procesamiento temporal y representación neuronal 


¿Cómo se representa el tiempo en el cerebro? ¿Cómo se perciben y 
producen pautas temporales complejas? El procesamiento de pautas 
temporales es un componente fundamental de la función sensorial y 
motriz. Dado el carácter intrínsecamente temporal de nuestra 
interacción con el entorno, comprender cómo el cerebro procesa el 
tiempo es un paso necesario para comprender el cerebro. Nos 


proponemos reunir a los psicólogos, neurocientíficos y teóricos más 
sobresalientes del mundo que estudian estos problemas. Nuestros 
objetivos son dobles: primero, queremos reunir a investigadores de 
diferentes campos que comparten un interés común en la 
sincronización y se beneficiarían notoriamente de una fecundación 
cruzada de ideas; segundo, se ha realizado mucho trabajo 
significativo hasta la fecha sobre el procesamiento de intervalo 
temporal único. Con vistas al futuro, deseamos aprender de esos 
estudios ampliando al mismo tiempo el análisis al procesamiento de 
pautas temporales compuestas de intervalos múltiples. La 
percepción de pautas temporales está creciendo como un campo 
multidisciplinario; prevemos que esta reunión puede ayudar a 
estudiar y establecer una investigación multidisciplinaria. 


Al principio, pensé que los organizadores habían cometido un error al 
incluir mi nombre en la lista. Conocía todos los nombres de los 
participantes invitados, que se incluían en el mensaje electrónico. Eran los 
gigantes del campo (los George Martin y Paul McCartney, los Seiji Ozawa 
y Yo-Yo Ma de la investigación de la sincronización y el tiempo). Paula 
Tallal había descubierto, con su colaborador Mike Merzenich, de la 
Universidad de California, en San Francisco, que la dislexia estaba 
relacionada con un déficit de la sincronización en los sistemas auditivos de 
los niños. Había publicado algunos de los estudios MRIf más influyentes 
sobre el habla y el cerebro, en los que mostraba dónde se producía el 
procesamiento fonético cerebral. Rich Ivry era un primo intelectual mío, 
uno de los neurocientíficos cognitivos más brillantes de mi generación, que 
se había doctorado con Steve Keele en la Universidad de Oregón y había 
hecho un trabajo innovador sobre el cerebelo y sobre los aspectos 
cognitivos del control motriz. Su actitud era muy modesta y práctica, y era 
capaz de abrir el corazón de un tema científico con la precisión de una 
cuchilla de afeitar. 

Randy Gallistel era un psicólogo matemático sobresaliente autor de 
modelos de procesos de aprendizaje y de memoria en humanos y ratones; 
yo había leído sus artículos exhaustivamente. Bruno Repp había sido primer 


asesor posdoctoral de Amandine Penel, y había revisado los dos primeros 
artículos que yo había publicado (los experimentos de gente cantando 
canciones pop muy cerca de la altura y el tempo correctos). También estaba 
invitada la otra especialista mundial en sincronización musical, Mari Reiss 
Jones. Había hecho el trabajo más importante sobre el papel de la atención 
en la cognición musical, y elaborado un modelo trascendental de cómo 
convergen para crear nuestro conocimiento de la estructura musical los 
acentos, el compás, el ritmo y las expectativas. ¡Iba a estar allí además John 
Hopfield, el creador de las redes Hopfield, una de las clases más 
importantes de modelos de red neuronal PDP! Cuando llegué a Cold Spring 
Harbor, me sentí como una fan entre bastidores en un concierto de Elvis en 
1957. 

La conferencia fue intensa. Los investigadores no podían ponerse de 
acuerdo en cuestiones básicas, como por ejemplo diferenciar un oscilador 
de un cronometrador, o si participan o no procesos neurales diferentes en el 
cálculo de la longitud de un intervalo silencioso frente a la de un lapso de 
tiempo lleno de pulsaciones regulares. 

Como grupo, comprendimos (como esperaban los organizadores) que lo 
que impedía un verdadero progreso en el campo era en gran parte que 
estábamos utilizando terminología diferente para referirnos a las mismas 
cosas, y en muchos casos estábamos utilizando una sola palabra (como 
«sincronización») con significados muy distintos, y que nos ateníamos a 
supuestos básicos muy diferentes. 

Cuando oyes a alguien utilizar un término como planum temporale (una 
estructura neuronal), piensas que está utilizándolo en el mismo sentido que 
tú. Pero en ciencia, como en música, las suposiciones pueden ser fatales. 
Unos consideraban que el planum temporale tenía que definirse 
anatómicamente, otros que funcionalmente. Discutimos sobre la 
importancia de la materia gris y de la materia blanca, sobre lo que significa 
que dos acontecimientos sean sincrónicos (¿tienen que suceder justo al 
mismo tiempo, o sólo en lo que parece ser perceptualmente al mismo 
tiempo?). 

De noche, nos sirvieron comida preparada y mucha cerveza y vino tinto 
y seguimos debatiendo mientras comíamos y bebíamos. Mi alumno de 


doctorado Bradley Vines, que acudió como observador, tocó el saxofón para 
todos. Yo toqué la guitarra con unos cuantos del grupo que eran músicos y 
Amandine cantó. 

Como el tema del encuentro era la sincronización, la mayoría de la 
gente no había prestado mucha atención al trabajo de Schmahmamn ni a la 
posible conexión entre la emoción y el cerebelo. Pero Ivry lo había hecho; 
conocía el trabajo de Schmahmanmn y le intrigaba. En nuestras discusiones, 
arrojó una luz sobre similitudes entre percepción musical y planificación de 
la acción motriz que yo no había sido capaz de ver en mi propio 
experimento. Se mostró de acuerdo en que el cerebelo tenía que estar 
implicado en las claves básicas del misterio de la música. Cuando conocí a 
Watson, me contó que él creía también que tenía que haber una conexión 
plausible entre el cerebelo, la sincronización, la música y la emoción. Pero 
¿Cuál podría ser esa conexión? ¿Cuál era su base evolutiva? 

Pocos meses después visité a mi estrecha colaboradora Ursula Bellugi 
en el Salk Institute de La Jolla, California. El Salk Institute se asienta en un 
trozo de tierra inmaculada con vistas al océano Pacífico. Bellugi, que 
estudió con el gran Roger Brown en Harvard en la década de los sesenta, 
dirige allí el Laboratorio de Neurociencia Cognitiva. Entre sus muchas, 
muchísimas «matrículas de honor» y los muchos hallazgos que 
establecieron nuevos hitos en su carrera, fue la primera que demostró que el 
lenguaje de señas es un verdadero lenguaje (con estructura sintáctica, no es 
sólo una colección ad hoc o desorganizada de gestos), demostrando con ello 
que el módulo lingúístico de Chomsky no es sólo para el lenguaje hablado. 
También ha realizado trabajo innovador en cognición espacial, gestos, los 
trastornos neuronales del desarrollo y la capacidad de las neuronas para 
cambiar de función, la neuroplasticidad. 

Ursula y yo llevamos diez años trabajando juntos en la tarea de 
descubrir las bases genéticas de la musicalidad. ¿Qué mejor lugar para 
ubicar la investigación que un instituto dirigido por Francis Crick, el 
hombre que descubrió, con Watson, la estructura del ADN? Yo había ido 
allí, como hago todos los años, para que pudiéramos examinar juntos 
nuestros datos y trabajar preparando artículos para la publicación. A Ursula 
y a mí nos gustaba sentarnos en la misma habitación, mirando la misma 


pantalla de ordenador, donde podíamos señalar los diagramas de 
cromosomas, examinar activaciones cerebrales y hablar sobre lo que 
significaban para nuestras hipótesis. 

Una vez por semana el Instituto celebraba una «comida de profesores» 
en la que venerables científicos se sentaban en torno a una gran mesa 
cuadrada con Francis Crick, el director de la institución. Raras veces se 
admitían visitantes; era un foro privado en el que los científicos se sentían 
con libertad para especular. Yo había oído hablar de aquel terreno sagrado y 
soñaba con poder visitarlo. 

Crick sostenía en su libro The Astonishing Hypothesis que la conciencia 
surge del cerebro, que la suma total de nuestros pensamientos, creencias, 
deseos y sentimientos procede de las actividades de las neuronas, las células 
gliálicas y las moléculas y átomos que las componen. Eso era interesante, 
pero como ya he dicho, yo soy más bien contrario a cartografiar la mente 
sólo por cartografiarla, y me inclino más por intentar entender cómo la 
maquinaria da origen a la experiencia humana. 

Crick me interesaba no por su brillante obra sobre el ADN y la 
administración del Instituto Salk de la que se encargaba, ni siquiera por The 
Astonishing Hypothesis. Era por su libro What Mad Pursuit, sobre sus 
primeros años dedicado a la ciencia. Fue, de hecho, concretamente este 
pasaje, porque también yo había empezado mi carrera científica algo tarde 
en la vida. 


Cuando se acabó por fin la guerra, yo no sabía qué hacer... Hice el 
recuento de mis calificaciones. Un título no muy bueno, redimido un 
tanto por mis logros en el Almirantazgo. Un conocimiento de ciertas 
partes limitadas de la hidrodinámica y el magnetismo. Temas por los 
que no sentía el menor entusiasmo. No había publicado 
absolutamente nada... Sólo de forma gradual empecé a entender que 
esa falta de cualificación podría ser una ventaja. Cuando llegan a los 
treinta años la mayoría de los científicos están atrapados por su 
propia especialización. Han invertido tanto esfuerzo en un campo 
particular que suele resultarles sumamente difícil, en ese período de 
su Carrera, realizar un cambio radical. Yo, por mi parte, no sabía 


nada, sólo tenía una formación básica en una física y unas 
matemáticas algo anticuadas y mi capacidad para dedicarme a cosas 
nuevas... Como no sabía básicamente nada, tenía una libertad de 
elección casi total... 


La propia investigación de Crick me había animado a mí a considerar mi 
falta de experiencia una licencia para pensar en la neurociencia cognitiva de 
una forma distinta a como lo hacían otros, y me impulsó a adentrarme más 
allá de lo que parecían los límites superficiales de mis propios alcances. 

Llegué en el coche al laboratorio de Ursula desde mi hotel una mañana 
para poder empezar temprano. «Temprano» para mí eran las siete de la 
mañana, pero Ursula llevaba ya en el laboratorio desde las seis. Cuando 
estábamos los dos trabajando en su despacho, tecleando en el ordenador, 
Ursula posó su café y me miró con un chispeo pixielesco en los ojos. «¿Te 
gustaría conocer hoy a Francis?» La coincidencia de que yo hubiese 
conocido sólo unos meses antes a Watson, Nobel gemelo de Crick, 
resultaba sorprendente. 

Me asaltó un viejo recuerdo y sentí una oleada de pánico. Cuando 
estaba empezando como productor de discos, Michelle Zarin, la directora 
de un gran estudio de grabación de San Francisco, Automatt, celebraba los 
viernes por la tarde encuentros en su oficina a los que sólo se invitaba a un 
grupo selecto. Durante muchos meses, mientras yo trabajaba con bandas 
desconocidas como los Afflicted y los Dimes, veía a la realeza del rock 
entrar en su despacho los viernes por la tarde: Carlos Santana, Huey Lewis, 
los productores Jim Gaines y Bob Johnston. Un viernes Michelle me dijo 
que iba a estar en la ciudad Ron Nevison, que había hecho la grabación de 
mis discos favoritos de Led Zeppelin, y había trabajado con los Who. Me 
llevó a su despacho y me indicó dónde debía colocarme en el semicírculo 
que empezaba a formarse. La gente charlaba y yo escuchaba con respeto. 
Pero Ron Nevison parecía no reparar en mí y era precisamente a quien yo 
quería conocer. Miré el reloj..., habían pasado quince minutos. Sonaba en 
el estéreo del rincón Boz Scaggs (otro cliente). «Lowdown.» «Lido.» 
Habían pasado veinte minutos. ¿Iba a conocer alguna vez a Nevison? Llegó 
«We're All Alone» y la letra se me metió debajo de la piel (como a veces 


puede hacer la música). Tenía que tomar yo la iniciativa. Me acerque a 
Nevison y me presenté. Él me estrechó la mano y volvió a la conversación 
en la que estaba metido. Eso fue todo. Michelle me riñó más tarde: esas 
cosas simplemente no se hacen. Si hubiese esperado a que ella me 
presentase, le habría recordado que yo era el joven productor del que le 
había hablado, el aprendiz potencial, el joven respetuoso e irreflexivo al que 
ella quería que conociese. Nunca volví a ver a Nevison. 

A la hora de comer, Ursula y yo salimos al cálido aire de primavera de 
San Diego. Se oían los chillidos de las gaviotas en el cielo. Fuimos hasta el 
rincón del campus del Salk que tenía la mejor vista del Pacífico y subimos 
tres tramos de escaleras hasta el comedor de los profesores. Yo reconocí 
inmediatamente a Crick, aunque parecía muy débil: estaba ya al final de los 
ochenta, llamando vacilante a la puerta de los noventa. Ursula me indicó un 
asiento que estaba a cuatro personas de distancia de él, a su derecha. 

La conversación en la comida era una cacofonía. Yo oía fragmentos de 
conversaciones sobre un gen cancerígeno que acababa de identificar uno de 
los profesores, y sobre el desciframiento de la genética del sistema visual 
del calamar. Otro de los comensales especulaba sobre una intervención 
farmacológica para retrasar la pérdida de memoria asociada con el 
Alzheimer. Crick escuchaba más que nada, pero hablaba de vez en cuando, 
con una voz tan apagada que yo no podía oír ni una palabra. El comedor fue 
vaciándose a medida que iban terminando de comer los profesores. 

Después del postre, Crick aún seguía a cuatro asientos de distancia de 
mí, hablando animadamente con alguien situado a su izquierda, dándonos la 
espalda. Yo quería conocerle, para hablar sobre The Astonishing 
Hypothesis, para saber qué pensaba de la relación entre cognición, emoción 
y control motriz. ¿Y qué opinaba el codescubridor de la estructura del ADN 
de una posible base genética de la música? 

Ursula, percibiendo mi impaciencia, dijo que me presentaría a Francis 
cuando saliésemos. Yo estaba decepcionado, previendo un «hola-adiós». 
Ursula me cogió por el codo; mide sólo uno cuarenta y cinco y tiene que 
estirarse para llegar. Me acercó a Crick, que estaba hablando de leptones y 
muones con un colega. Le interrumpió. «Francis —dijo—, quería 
presentarte a mi colega Dan Levitin, de McGill, que trabaja sobre Williams 


y la música conmigo.» Antes de que Crick pudiese decir una palabra, 
Ursula me empujó por el codo hacia la puerta. A Crick se le iluminaron los 
ojos. Se incorporó en su asiento. «Música —dijo. Se olvidó de su colega de 
los leptones—. Me gustaría hablar contigo sobre eso alguna vez.» «Bueno 
—dijo Ursula astutamente—, tenemos algo de tiempo en este momento.» 

Crick quería saber si habíamos hecho estudios de neuroimágenes de la 
música; le hablé de los que habíamos hecho respecto a la música y el 
cerebelo. Le intrigaron nuestros resultados y la posibilidad de que el 
cerebelo pudiese intervenir en la emoción musical. El papel del cerebelo 
ayudando a intérpretes y directores a seguir el compás musical y a mantener 
un tempo constante era algo sabido. Muchos suponían también que el 
cerebelo participaba en el seguimiento del compás musical en los oyentes. 
Pero ¿dónde encajaba la emoción? ¿Cuál podría haber sido la conexión 
evolutiva entre emoción, sincronización y movimiento? 

En primer lugar, ¿cuál podría ser la base evolutiva de las emociones? 
Los científicos no pueden ponerse de acuerdo ni siquiera sobre lo que son 
las emociones. Distinguimos entre emociones (estados temporales que 
suelen deberse a algún acontecimiento exterior, presente, recordado O 
anticipado), estados de ánimo (estados no tan temporales, de más larga 
duración, que pueden o no tener una causa externa) y rasgos (una 
proclividad o tendencia a determinados estados, como por ejemplo «ella es 
en general una persona feliz» o «él nunca parece satisfecho»). Algunos 
científicos utilizan la palabra «afecto» para referirse a la valencia (positiva 
o negativa) de nuestros estados internos, y reservan la palabra «emoción» 
para referirse a estados particulares. Afecto puede así asumir sólo dos 
valores (o un tercer valor si se cuenta «estado no afectivo») y dentro de 
Cada uno tenemos una gama de emociones: entre las emociones positivas se 
incluirían la felicidad y la saciedad, entre las negativas el miedo y la cólera. 

Crick y yo hablamos de cómo en la historia evolutiva las emociones 
estaban estrechamente relacionadas con la motivación. Crick me recordó 
que las emociones de nuestros antiguos ancestros homínidos eran un estado 
neuroquímico que servía para motivarnos a actuar, generalmente por 
motivos de supervivencia. Vemos un león e instantáneamente genera miedo, 
un estado interno (una emoción) que se produce cuando se logra un 


determinado cóctel de neurotransmisores e índices de activación. Ese estado 
que llamamos «miedo» nos hace dejar lo que estuviésemos haciendo y (sin 
pensarlo siquiera) correr. Comemos algo en malas condiciones y sentimos 
la emoción del asco; de inmediato se disparan ciertos reflejos fisiológicos, 
como taparse la nariz (para impedir que penetre un posible aroma tóxico) y 
sacamos la lengua (para expulsar el alimento malsano); contraemos también 
el cuello para limitar la cantidad de alimento que nos llegue al estómago. 
Vemos una extensión de agua después de llevar vagando horas y nos 
entusiasmamos: bebemos y nos invade la saciedad con una sensación de 
bienestar y alegría, emociones que nos harán recordar la próxima vez dónde 
está esa extensión de agua. 

No todas las actividades emotivas conducen a movimientos motores, 
pero muchas de las importantes sí, y correr figura a la cabeza de ellas. 
Corremos mucho más deprisa y con mucha mayor eficacia si lo hacemos 
con un paso regular: así es menos probable que demos un traspiés o 
perdamos el equilibrio. El papel del cerebelo está claro en este caso. Y 
también parece razonable la idea de que las emociones puedan estar 
relacionadas con las neuronas cerebelares. Las actividades de supervivencia 
más cruciales entrañan a menudo correr (para huir de un predador o tras la 
presa que escapa) y nuestros ancestros necesitaban reaccionar rápida, 
instantáneamente, sin analizar la situación y estudiar la mejor forma de 
actuar. En suma, aquellos ancestros que estaban dotados de un sistema 
emotivo directamente conectado con el sistema motriz podían reaccionar 
más rápido, y vivir así para reproducirse y transmitir sus genes a otra 
generación. 

A Crick lo que le interesaba sobre todo, más que los orígenes evolutivos 
de la conducta, eran los datos. Había leído la obra de Schmahmann, que 
estaba intentando resucitar muchas viejas ideas que habían caído en 
desgracia o simplemente se habían olvidado, como por ejemplo un artículo 
de 1934 en el que se indicaba que el cerebelo participaba en la modulación 
de la excitación, la atención y el sueño. Durante la década de los sesenta 
nos enteramos de que lesiones en determinadas zonas del cerebelo podían 
provocar cambios espectaculares en la excitación. Monos con una lesión en 
una parte del cerebelo experimentaban cólera, una cólera llamada por los 


científicos infundada, debido a que no había en el entorno nada que 
provocase esa reacción. (Por supuesto, los monos tenían todos los motivos 
para estar furiosos, ya que algún cirujano les había lesionado parte del 
cerebro, pero de acuerdo con los experimentos sólo mostraban cólera 
después de sufrir esas lesiones cerebelares, y no otras.) Las lesiones en otras 
partes del cerebelo provocaban calma, y se habían utilizado clínicamente 
para calmar a esquizofrénicos. La estimulación eléctrica de una fina capa de 
tejido del centro del cerebelo, llamada la vermis, podía provocar 
agresividad en los seres humanos, y en una región diferente una 
disminución de la angustia y de la depresión. 

Crick aún tenía delante el plato del postre y lo apartó a un lado. Tenía 
cogido con una mano un vaso de agua con hielo. Podía verle las venas de 
las manos a través de la piel. Durante un instante creí que podía realmente 
verle el pulso. Se quedó en silencio un momento, con la mirada fija, 
pensando. Había un silencio completo ya en el comedor, pero podíamos oír 
abajo el estruendo de las olas a través de la ventana abierta. 

Hablamos del trabajo de los neurobiólogos que habían demostrado en 
los años setenta que el oído interno no envía todas sus conexiones al córtex 
auditivo, como se creía antes. En gatos y ratas, animales cuyos sistemas 
auditivos se conocen bien y muestran una marcada semejanza con los 
nuestros, hay proyecciones directas desde el oído interno al cerebelo 
(conexiones que entran en el cerebelo desde el oído) que coordinan los 
movimientos que participan en la orientación del animal hacia un estímulo 
auditivo en el espacio. Hay incluso neuronas sensibles a la ubicación en el 
cerebelo, una forma eficaz de orientar rápidamente la cabeza o el cuerpo 
hacia una fuente de sonido. Esas áreas envían a su vez proyecciones a las 
áreas del lóbulo frontal que mis estudios con Vinod Menon y Ursula 
descubrieron que participaban en el procesamiento del lenguaje y de la 
música, regiones del córtex orbitofrontal y frontal inferior. ¿Qué estaba 
pasando? ¿Por qué razón las conexiones que partían del oído eludían el 
córtex auditivo, el área de recepción central para la audición, y enviaban 
masas de fibras al cerebelo, un centro de control motriz (y tal vez, 
estábamos enterándonos, de la emoción)? 


La redundancia y la distribución de la función son principios cruciales 
en neuroanatomía. El meollo del asunto es que un organismo tiene que vivir 
lo suficiente para transmitir sus genes a través de la reproducción. La vida 
es peligrosa; hay muchísimas posibilidades de recibir un golpe en la cabeza 
y perder alguna función cerebral. Para que el organismo siga funcionando 
después de una lesión cerebral es necesario que un golpe en una sola parte 
del cerebro no desbarate todo el sistema. Los sistemas cerebrales 
importantes elaboraron evolutivamente vías suplementarias adicionales. 

Nuestro sistema perceptivo está afinado de forma exquisita para detectar 
cambios en el entorno, ya que un cambio puede ser una señal de que el 
peligro es inminente. Comprobamos eso con cada uno de los cinco sentidos. 
Nuestro sistema visual, aunque dotado de una capacidad que le permite 
apreciar millones de colores y ver en la oscuridad cuando la iluminación es 
tan tenue como un fotón en un millón, es el más sensible al cambio súbito. 
Una región completa del córtex visual, el área MT, está especializada en la 
detección del movimiento; las neuronas se activan allí cuando se mueve en 
nuestro campo visual un objeto. Todos hemos tenido la experiencia de que 
se nos pose un insecto en el cuello e instintivamente le demos un manotazo: 
nuestro sistema táctil percibió un cambio muy sutil de presión en la piel. Y 
aunque es ya un tópico de los tebeos de los niños, el poder de un cambio 
olfativo (el olor que llega por el aire de una tarta de manzana enfriándose en 
el alféizar de la casa de al lado) puede provocar en nosotros una reacción de 
alerta y de orientación. Pero los sonidos desencadenan de forma 
Característica las mayores reacciones de sobresalto. Un ruido súbito nos 
hace saltar de nuestro asiento, girar la cabeza, agacharnos o taparnos los 
oídos. 

El sobresalto auditivo es la más rápida de nuestras reacciones al 
sobresalto, y puede considerarse la más importante. Esto tiene sentido: en el 
mundo en que vivimos, rodeados de una capa de atmósfera, el movimiento 
súbito de un objeto (sobre todo uno grande) provoca una perturbación del 
aire. Percibimos este movimiento de moléculas del aire como sonido. El 
principio de redundancia dicta que nuestro sistema nervioso tenga que ser 
Capaz de reaccionar al mensaje sonoro aunque pueda llegar a lesionarse 
parcialmente. Cuanto más profundizamos en el cerebro, más vías 


redundantes encontramos, más circuitos latentes y más conexiones entre 
sistemas de las que antes no teníamos noticia. Estos sistemas secundarios 
cumplen una función importante de supervivencia. En la literatura científica 
han aparecido recientemente artículos sobre individuos cuyas vías visuales 
fueron cortadas, pero que a pesar de ello pueden «ver». Aunque no tengan 
conciencia de ver nada (de hecho, aseguran que están ciegos) pueden 
orientarse hacia objetos y en algunos casos identificarlos. 

Parece haber también un sistema auditivo rudimentario O 
complementario en el que participa el cerebelo. Esto preserva nuestra 
capacidad para reaccionar con rapidez (emotivamente y con el movimiento) 
a sonidos que puedan ser peligrosos. 

El circuito de habituación está relacionado con el reflejo de sobresalto y 
con la exquisita sensibilidad del sistema auditivo al cambio. Si tu 
refrigerador tiene un zumbido, llegas a acostumbrarte tanto a él que ya no lo 
percibes: eso es habituación. Una rata que duerme en su agujero en el suelo 
oye encima un ruido fuerte. Podría ser la pisada de un predador, y debería 
sobresaltarse inmediatamente. Pero podría ser también el ruido de una rama 
movida por el viento que golpea el suelo encima de una forma más o menos 
rítmica. Si después de una o dos docenas de golpes de la rama contra el 
tejado de su casa la rata descubre que no hay ningún peligro, no debería 
prestar atención a esos sonidos, y comprender que no son ninguna amenaza. 
Si cambiasen la intensidad o la frecuencia, eso indicaría que las condiciones 
del entorno han cambiado y que debería estar alerta. Tal vez haya arreciado 
el viento y su mayor velocidad haga que la rama agujeree el techo de su 
residencia de roedor. Tal vez el viento haya amainado, y podrá salir sin 
problemas y buscar alimento y pareja sin miedo a que vientos huracanados 
la arrastren. La habituación es un proceso importante y necesario para 
diferenciar lo amenazador de lo que no lo es. El cerebelo actúa como una 
especie de cronometrador, de modo que cuando está dañado, su capacidad 
para rastrear la regularidad de la estimulación sensorial queda 
comprometida y la habituación se va al garete. 

Ursula le contó a Crick el descubrimiento de Albert Galaburda en 
Harvard de que en los individuos con el síndrome de Williams (SW) el 
cerebelo se forma defectuosamente. Este síndrome se produce cuando faltan 


unos veinte genes en un cromosoma (el cromosoma 7). Ocurre en uno de 
cada 20.000 nacimientos, por lo que su frecuencia es cuatro veces menor 
que la del trastorno del desarrollo más conocido denominado síndrome de 
Down. El síndrome de Williams, como el de Down, se debe a un error de 
transcripción genética que se produce en las primeras etapas del desarrollo 
fetal. La pérdida de esos veinte genes de los aproximadamente 25.000 que 
tenemos resulta devastadora. Quienes sufren síndrome de Williams pueden 
padecer una discapacidad intelectual profunda. Pocos aprenden a contar, 
saber la hora, o leer. Sin embargo, tienen más o menos intactas las 
habilidades  lingúísticas, son muy buenos para la música y 
extraordinariamente extrovertidos y agradables; son, en realidad, más 
emotivos que el resto de nosotros, y desde luego más cordiales y sociables 
que el individuo medio. Hacer música y conocer gente nueva tienden a ser 
dos de sus actividades favoritas. Schmahmann había descubierto que las 
lesiones en el cerebelo pueden crear síntomas similares a los del síndrome 
de Williams; la persona se volvía de pronto muy extrovertida y mostraba 
una familiaridad excesiva con los desconocidos. 

Hace un par de años me pidieron que visitase a un adolescente con 
síndrome de Williams. Kenny, que era como se llamaba, era extrovertido, 
alegre y le encantaba la música, pero tenía un coeficiente de inteligencia de 
menos de cincuenta, lo que significaba que a los catorce años de edad tenía 
la capacidad mental de un niño de siete. Además, como la mayoría de la 
gente afectada por el síndrome de Williams, tenía una coordinación ojo- 
mano muy pobre, por lo que le resultaba difícil abotonarse (tenía que 
ayudarle su madre), atarse los cordones de los zapatos (usaba tiras Velcro en 
vez de cordones) e incluso tenía dificultades para subir escaleras o llevarse 
la comida del plato a la boca. Pero tocaba el clarinete. Había aprendido unas 
cuantas piezas y era Capaz de ejecutar los numerosos y complicados 
movimientos digitales necesarios para tocarlas. No era capaz de nombrar las 
notas, y no podía explicarme lo que estaba haciendo en ningún punto de la 
pieza: era como si sus dedos tuviesen una mente propia. ¡De pronto los 
problemas de coordinación ojo-mano habían desaparecido! Pero luego, en 
cuanto paraba de tocar, necesitaba ayuda para abrir la caja y meter otra vez 
en ella el clarinete. 


Allan Reiss, de la facultad de medicina de la Universidad de Stanford, 
ha demostrado que el neocerebelo, la zona más reciente del cerebelo, es 
mayor de lo normal en las personas que padecen síndrome de Williams. 
Había algo en el movimiento de la gente con síndrome de Williams, cuando 
podía adiestrarse para la música, que era distinto de otros tipos de 
movimiento. Dado que su morfometría cerebelar era diferente de la de los 
demás, parecería indicar que el cerebelo podría ser la parte que tendría una 
«mente propia», y decirnos algo sobre cómo influye normalmente el 
cerebelo en el procesamiento de la música para los que no tienen síndrome 
de Williams. El cerebelo es decisivo para algo relacionado con la emoción: 
sobresalto, miedo, cólera, calma, sociabilidad. Ahora participaba también 
en un procesamiento auditivo. 

Crick, que seguía sentado conmigo, mucho después de que hubiesen 
retirado los platos de la comida, mencionó «el problema del vínculo», uno 
de los problemas más difíciles de la neurociencia cognitiva. La mayoría de 
los objetos tienen un número de rasgos diferentes que son procesados por 
subsistemas neuronales independientes: en el caso de los objetos visuales, 
estos rasgos podrían ser color, forma, movimiento, contraste, tamaño, etc. 
El cerebro tiene que «vincular» de algún modo estos componentes de la 
percepción diferentes e independientes en un todo coherente. Ya he 
explicado que los científicos cognitivos creen que la percepción es un 
proceso constructivo, pero ¿qué es lo que hacen realmente las neuronas para 
juntarlo todo? Sabemos que eso es un problema por el estudio de pacientes 
con determinadas lesiones o enfermedades neuropáticas como el síndrome 
de Balint. Las personas que lo padecen pueden reconocer uno o dos rasgos 
de un objeto, pero son incapaces de relacionarlos. Algunos pacientes 
pueden decirte dónde está situado un objeto dentro de su campo visual pero 
no su color, o viceversa. Otros pacientes oyen el timbre y el ritmo pero no la 
melodía o viceversa. ¡Isabelle Peretz descubrió un paciente que tiene oído 
absoluto pero es sordo al tono! Puede nombrar las notas perfectamente, 
pero sería incapaz de cantar aunque le fuese en ello la vida. 

Una solución al problema de la vinculación, propuso Crick, era la 
activación sincrónica de neuronas a lo largo del córtex. Parte de la 
«hipótesis asombrosa» del libro de Crick era que la conciencia aflora por la 


activación sincrónica, a 40 hercios, de neuronas en el cerebro. Los 
neurocientíficos habían considerado en general que las operaciones del 
cerebelo se producían a un nivel «preconsciente» porque el cerebelo 
coordina acciones como correr, caminar, coger o alcanzar algo, que no se 
hallan normalmente bajo control consciente. No hay ninguna razón por la 
que las neuronas cerebelares no puedan activarse a 40 hercios para 
contribuir a la conciencia, dijo, aunque normalmente no atribuyamos 
conciencia similar a la humana a los organismos que sólo tienen cerebelo, 
como los reptiles. «Examina las conexiones», dijo. Él había estudiado 
neuroanatomía durante su período en Salk, y se había dado cuenta de que 
muchos de los que investigaban en neurociencia cognitiva no se estaban 
ateniendo a sus propios principios básicos, a utilizar el cerebro como marco 
delimitador de las hipótesis; Crick tenía poca paciencia con eso, y creía que 
sólo se podría avanzar estudiando rigurosamente los aspectos funcionales y 
estructurales del cerebro. 

El colega de los leptones había vuelto por entonces, recordándole a 
Crick una cita inminente. Nos levantamos todos para irnos y Crick se volvió 
hacia mí por última vez y repitió: «Examina las conexiones...». No volví a 
verle. Murió pocos meses después. 

La conexión entre el cerebelo y la música no era tan difícil de ver. Los 
participantes en la reunión de Cold Spring Harbor hablaban de cómo el 
lóbulo frontal (el centro de las cogniciones más avanzadas de los humanos) 
está directamente conectado con el cerebelo, la parte más primitiva del 
cerebro. Las conexiones van en ambas direcciones, así que las dos 
estructuras se influyen mutuamente. Las regiones del córtex frontal que 
estaba estudiando Paula Tallal (las que nos ayudan a apreciar diferencias 
precisas en los sonidos del habla) estaban también conectadas con el 
cerebelo. El trabajo de Ivry sobre control motriz mostró que había 
conexiones entre los lóbulos frontales, el córtex occipital (y la franja 
motriz) y el cerebelo. Pero había otro intérprete en esta sinfonía neuronal, 
una estructura profundamente hundida en el córtex. 

En 1999, en un estudio que hizo época, Anne Blood, una docente 
posdoctoral que trabajaba con Robert Zatorre en el Instituto Neurológico de 
Montreal, había demostrado que la emoción musical intensa (lo que sus 


sujetos describían como «escalofríos y  estremecimientos») estaba 
relacionada con regiones cerebrales que se consideraba que participaban en 
el proceso de recompensa, motivación y excitación: el striatum ventral, la 
amígdala, el cerebro medio y regiones del córtex frontal. Yo estaba en 
especial interesado en el striatum ventral, una estructura que incluye el 
nucleus accumbens, porque este último es el centro del sistema de 
recompensa del cerebro, y juega un papel importante en el placer y en la 
adicción. Se activa cuando los jugadores ganan una apuesta, o los 
consumidores de drogas toman su droga favorita. Está también íntimamente 
relacionado con la transmisión de opiáceos en el cerebro, a través de su 
capacidad para liberar el neurotransmisor dopamina. Avram Goldstein había 
demostrado en 1980 que el placer de escuchar música podía bloquearse 
administrando la droga nalaxone, que se creía que bloqueaba la dopamina 
en el nucleus accumbens. Pero el tipo concreto de escáner cerebral que 
habían utilizado Blood y Zatorre, la tomografía de emisión positrónica, no 
tiene una resolución espacial lo bastante elevada para detectar si participaba 
en el asunto el pequeño nucleus accumbens. Vinod Menon y yo teníamos 
datos abundantes obtenidos con la MRIf de más alta resolución, y 
disponíamos de potencial resolutivo para determinarlo. Pero para precisar 
del todo la historia de cómo se produce placer en el cerebro en respuesta a 
la música tendríamos que demostrar que el nucleus accumbens actuaba en 
el momento justo en que se activa una secuencia de estructuras neuronales 
durante la audición de música, tras la activación de estructuras del lóbulo 
frontal que procesa el contenido y la estructura musicales. Y para saber si 
ése era el papel del nucleus accumbens como modulador de la dopamina, 
teníamos que hallar un medio de demostrar que su activación se producía al 
mismo tiempo que la de otras estructuras cerebrales que participaban en la 
producción y transmisión de dopamina, porque si no, no podríamos alegar 
que su participación fuese algo más que simple coincidencia. Por último, 
como había tantos indicios que parecían señalar al cerebelo, que sabemos 
que tiene también receptores de dopamina, debía aparecer también en ese 
análisis. 

Menon acababa de leer algunos artículos de Karl Friston y sus colegas 
sobre una nueva técnica matemática, llamada análisis de conectividad 


funcional y efectiva, que nos permitía afrontar esos problemas, y revelar 
cómo diferentes regiones cerebrales interactúan durante las operaciones 
cognitivas. Estos nuevos análisis de conectividad nos permitirían detectar 
asociaciones entre regiones neuronales en el procesamiento de la música 
que no podían abordarse con técnicas convencionales. Midiendo la 
interacción de una región cerebral con otra (delimitada por nuestro 
conocimiento de las conexiones anatómicas entre ellas), la técnica nos 
permitiría efectuar un examen momento a momento de las redes neurales 
provocadas por la música. Eso es sin duda lo que habría querido ver Crick. 
La tarea no era fácil; los experimentos de escaneo cerebral producen 
millones y millones de puntos de datos; una sola sesión puede ocupar todo 
el disco duro de un ordenador normal. Analizar los datos de la forma 
ordinaria (sólo para ver qué áreas son activadas, no el nuevo tipo de análisis 
que nos proponíamos) puede llevar meses. Y no había un programa 
estadístico «prefabricado» que hiciese esos nuevos análisis por nosotros. 
Menon se pasó tres meses trabajando en las ecuaciones necesarias para 
hacer esos análisis, y cuando acabó, reanalizamos los datos que yo había 
recogido de gente escuchando música clásica. 

Descubrimos exactamente lo que habíamos esperado encontrar. La 
audición de música provocaba que se activasen en un orden determinado 
una cascada de regiones cerebrales: primero, el córtex auditivo para el 
procesamiento inicial de los componentes del sonido. Luego regiones 
frontales, como BA44 y BA47, que habíamos determinado previamente que 
participaban en el procesamiento de las expectativas musicales y la 
estructura musical. Finalmente, una red de regiones (el sistema 
mesolímbico) que participaban en la excitación, el placer y la transmisión 
de opiáceos y la producción de dopamina, para culminar con la activación 
del nucleus accumbens. Y a lo largo de todo el proceso se mantenían 
activos el cerebelo y los ganglios basales, apoyando de manera presumible 
el procesamiento de ritmo y compás. En los aspectos de recompensa y 
reforzamiento de la audición de música parecen, pues, intervenir niveles 
crecientes de dopamina en el nucleus accumbens y la contribución del 
cerebelo en la regulación de la emoción a través de sus conexiones con el 
lóbulo frontal y el sistema límbico. Las teorías neuropsicológicas vigentes 


asocian estado de ánimo positivo y afecto con un aumento de los niveles de 
dopamina, uno de los motivos de que muchos de los antidepresivos más 
recientes actúen sobre el sistema dopaminérgico. La música es claramente 
un medio para mejorar el estado de ánimo de la gente. Ahora creemos que 
sabemos por qué. 

La música parece remedar algunos rasgos del lenguaje y transmitir 
algunas de las mismas emociones que transmite la comunicación vocal, 
pero de un modo no referencial y no específico. Activa también algunas de 
las mismas regiones neuronales que activa el lenguaje, pero la música 
aprovecha mucho más que el lenguaje estructuras del cerebro primitivo que 
participan en la motivación, la recompensa y la emoción. Ya se trate de los 
primeros toques del cencerro de «Honky Tonk Women» o de las primeras 
notas de «Sheherezade», sistemas computacionales del cerebro sincronizan 
osciladores neuronales con la cadencia de la música, y empiezan a predecir 
cuándo se producirá el próximo tiempo fuerte. A medida que la música se 
despliega, el cerebro va actualizando constantemente sus cálculos de 
cuándo se producirán nuevos tiempos, y se complace de que un músico 
habilidoso viole esa expectativa de una forma interesante (una especie de 
broma musical en la que todos participamos). La música respira, acelera y 
aminora exactamente igual que lo hace el mundo real, y nuestro cerebelo 
goza ajustándose para mantenerse sincronizado. 

La música eficaz (groove) incluye violaciones sutiles de sincronización. 
Igual que la rata experimenta una reacción emotiva ante una violación del 
ritmo en el golpeteo de la rama sobre su casa, nosotros experimentamos una 
reacción emotiva ante la violación del ritmo en la música que es groove. La 
rata, sin ningún contexto para la violación del ritmo, lo experimenta como 
miedo. Nosotros sabemos a través de la cultura y de la experiencia que la 
música no es amenazadora, y nuestro sistema cognitivo interpreta esas 
violaciones como una fuente de placer y de diversión. Esta reacción 
emocional a lo groove se produce vía oído-cerebelo-nucleus accumbens- 
circuito límbico más que vía oído-circuito del córtex auditivo. Nuestra 
reacción a lo groove es mayoritariamente pre o inconsciente, porque pasa a 
través del cerebelo en vez de hacerlo a través de los lóbulos frontales. Lo 


notable es que todas esas vías diferentes se integren en nuestra experiencia 
de una canción única. 

La historia de lo que hace tu cerebro cuando oye música es la historia de 
una orquestación exquisita de regiones cerebrales, en la que participan las 
zonas más antiguas y más recientes del cerebro humano, regiones tan 
apartadas como el cerebelo, situado en la parte de atrás de la cabeza, y los 
lóbulos frontales, justo detrás de los ojos. Se trata de una coreografía 
precisa de liberación y respuesta neuroquímicas entre sistemas lógicos de 
predicción y sistemas emotivos de recompensa. Cuando nos gusta una pieza 
de música, nos recuerda otra música que hemos oído, y eso activa huellas 
mnemotécnicas de períodos emotivos de nuestras vidas. La relación entre tu 
cerebro y la música consiste toda ella, como repitió Francis Crick cuando 
abandonamos aquel comedor, en conexiones. 
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¿QUÉ SE NECESITA PARA SER MÚSICO? 


DISECCIÓN DE LA MAESTRÍA 


Frank Sinatra, en su álbum Songs for Swinging Lovers, muestra un control 
asombroso de su expresión emotiva, del ritmo y del tono. En fin, yo no soy 
un fanático de Sinatra. Sólo tengo una media docena de los más de 
doscientos álbumes que ha publicado, y no me gustan sus películas. La 
verdad es que la mayor parte de su repertorio me parece sencillamente 
ñoño; y todo lo de después de 1980 me suena demasiado chulesco. Hace 
años Billboard me encargó una crítica de su último álbum, duetos con 
cantantes populares como Bono y Gloria Estefan. Puse el disco por los 
suelos, llegando a decir que Frank «canta con la satisfacción de un hombre 
que acabase de matar a alguien». 

Pero en Swinging Lovers, cada nota que canta está perfectamente 
emplazada en el ritmo y el tono. No quiero decir «perfectamente» en el 
sentido estricto y según la partitura; ritmos y sincronización son del todo 
equivocados de acuerdo con cómo está escrita la música sobre el papel, 
pero son perfectos para expresar emociones que no se pueden describir. Su 
fraseo contiene matices increíblemente detallados y sutiles...; ser capaz de 
prestar atención a tanto detalle, ser capaz de controlarlo, es algo que a mí 
me resulta inverosímil. Intenta cantar con él cualquier canción de Swinging 
Lovers. No he conocido a nadie que fuese capaz de seguirle con exactitud 
en el fraseo: hay demasiados matices, es demasiado extravagante, 
demasiado idiosincrásico. 


¿Cómo se convierte uno en un músico experto? ¿Y cómo es que de los 
millones de personas que reciben clases de música en la infancia, son 
relativamente pocos los que siguen tocando de adultos? Muchas personas, 
cuando se enteran de qué es lo que hago yo para ganarme la vida, me dicen 
que les encanta oír música, pero que sus lecciones de música «no dieron 
fruto». Yo creo que son demasiado duros consigo mismos. El abismo que 
media entre los expertos musicales y profesionales de la música se ha hecho 
tan grande en nuestra cultura que la gente se desalienta y por alguna razón 
esto sólo pasa con la música. Aunque la mayoría no podamos jugar al 
baloncesto como Shaquille O*Neal, ni cocinar como un chef, podemos 
disfrutar de todos modos jugando a encestar amigablemente en el patio de 
atrás de casa, o cocinando un día de fiesta para la familia y los amigos. Este 
abismo en la práctica de la música parece ser cultural, específico de la 
sociedad occidental contemporánea. Y aunque mucha gente dice que las 
lecciones de música no dieron resultado, los neurocientíficos cognitivos han 
descubierto en sus laboratorios que no es así. Una exposición, aunque sea 
pequeña, a lecciones de música en la infancia crea circuitos neuronales para 
el procesamiento de la música estimulados y más eficientes que los de los 
que carecen de esa instrucción. Las lecciones de música nos enseñan a 
escuchar mejor, y aceleran nuestra capacidad para discernir entre estructura 
y forma en música, haciendo que nos resulte más fácil decir qué música es 
la que nos gusta y la que no nos gusta. 

Pero ¿qué decir de esa clase de personas que todos reconocemos que 
son auténticos expertos musicales, los Alfred Brendel, Sarah Chang, 
Wynton Marsalis y Tori Amos? ¿Cómo consiguieron ellos lo que la mayoría 
de nosotros no tenemos, esa facilidad extraordinaria para tocar e 
interpretar? ¿Poseen acaso una serie de capacidades (o de estructuras 
neuronales) que son de un tipo diferente de las que tenemos el resto de los 
mortales (una diferencia de género) o simplemente más de esa misma 
materia básica de la que todos nosotros estamos dotados (una diferencia de 
grado)? Y ¿tienen los compositores y los que escriben canciones un 
conjunto de dotes básicamente distinto del de los intérpretes? 

El estudio científico de la maestría ha sido un tema importante dentro de 
la ciencia cognitiva durante los últimos treinta años, y la maestría musical 


ha tendido a estudiarse dentro del contexto de la maestría general. En casi 
todos los casos, la maestría musical se ha definido como pericia técnica: 
dominio de un instrumento o de dotes compositivas. El difunto Michael 
Howe, y sus colaboradores Jane Davidson y John Sloboda, pusieron en 
marcha un debate internacional cuando preguntaron si es científicamente 
defendible la noción vulgar de «talento». Partieron de la dicotomía 
siguiente: O bien los niveles elevados de pericia musical se basan en 
estructuras cerebrales innatas (lo que denominamos «talento»), o son sólo el 
resultado de la práctica y de la instrucción. Ellos definen el talento como 
algo 1) que se origina en estructuras genéticas; 2) que es identificable en 
una etapa temprana por gente instruida que puede reconocerlo antes incluso 
de que se haya adquirido un grado excepcional de pericia; 3) que se puede 
utilizar para predecir quién es probable que sobresalga, y 4) que sólo se 
puede identificar a una minoría como dotada de él porque si todo el mundo 
lo tuviese el concepto perdería sentido. La insistencia en una identificación 
exige que estudiemos el desarrollo de habilidades en los niños. Ellos añaden 
que en un campo como el de la música, el «talento» podría manifestarse de 
forma diferente en diferentes niños. 

Es evidente que algunos niños adquieren habilidades más deprisa que 
otros: la edad a que se empieza a caminar, a hablar y controlar los esfínteres 
varía mucho de un niño a otro, incluso en el mismo hogar. Pueden 
intervenir en ello factores genéticos, pero es difícil diferenciar otros factores 
secundarios (con un componente presumiblemente ambiental) como 
motivación, personalidad y dinámica de la familia. Factores similares 
pueden influir en el desarrollo musical y pueden ocultar las aportaciones de 
la genética a la capacidad musical. Los estudios del cerebro no han sido 
hasta ahora de gran utilidad para aclarar estas cuestiones porque ha sido 
difícil separar causa y efecto. Gottfried Schlaug, de Harvard, reunió 
escáners cerebrales de individuos con oído absoluto y demostró que una 
región del córtex auditivo (el planum temporale) es mayor en los que tienen 
oído absoluto que en los que no lo tienen. Esto parece indicar que el planum 
interviene en el oído absoluto, pero no está claro si empieza siendo más 
grande en la gente que acabará adquiriendo oído absoluto o si será más bien 
que la adquisición del oído absoluto hace que el planum aumente de 


tamaño. La historia está más clara en las zonas del cerebro que participan 
en movimientos motrices especializados. Los estudios de violinistas de 
Thomas Elbert han demostrado que la región del cerebro responsable del 
movimiento de la mano izquierda (la mano a la que se exige la máxima 
precisión al tocar el violín) aumenta de tamaño como consecuencia de la 
práctica. Aún no sabemos si la tendencia al aumento es preexistente en 
algunos casos y en otros no. 

La prueba más firme de la tesis del talento es que algunas personas 
adquieren simplemente habilidades musicales más rápido que otras. Las 
pruebas contrarias a esa tesis (o más bien, favorables a la idea de que la 
perfección viene con la práctica) proceden de las investigaciones sobre 
cuánta formación y ejercitación reciben los especialistas y los grandes 
profesionales de la música. Los especialistas en música, como los 
especialistas en matemáticas, en ajedrez o en los deportes, tienen que pasar 
por largos períodos de estudio y práctica para adquirir las dotes necesarias 
para sobresalir de verdad. Se ha comprobado en varios estudios que los 
mejores estudiantes de los conservatorios eran los que más habían 
practicado, a veces el doble que aquellos a los que no se consideraba 
buenos. 

En otro estudio, se dividió secretamente a los alumnos en dos grupos 
(sin revelárselo para no condicionarlos) basándose en las valoraciones de 
los profesores de su capacidad, o del talento que apreciaban en ellos. Varios 
años después, los que lograron los niveles más altos de maestría fueron los 
que más habían practicado con independencia de a qué grupo de «talento» 
habían sido asignados previamente. Esto parece indicar que la práctica es la 
Causa del logro, no simplemente algo correlacionado con él. Sugiere 
también que el uso que hacemos de la etiqueta «talento» es una forma de 
círculo vicioso: cuando decimos que alguien tiene talento, pensamos que 
queremos decir que tiene cierta predisposición innata a sobresalir, pero en el 
fondo, sólo aplicamos el término retrospectivamente, después de que se han 
alcanzado logros significativos. 

Anders Ericsson, de la Universidad del Estado de Florida, y sus colegas 
enfocan el tema de la maestría musical como un problema general de 
psicología cognitiva, el de cómo los seres humanos se convierten en general 


en expertos. Es decir, parte del supuesto de que hay ciertos temas 
relacionados con el hecho de convertirse en un experto en cualquier cosa; 
que podemos aprender sobre la pericia musical estudiando a matemáticos, 
artistas, atletas, ajedrecistas y escritores expertos, además de músicos. 

Primero, ¿qué queremos decir con «experto»? En general queremos 
decir que es alguien que ha alcanzado un alto grado de pericia en relación 
con otros. La maestría, en cuanto tal, es un juicio social; estamos haciendo 
una afirmación sobre unos cuantos miembros de una sociedad respecto a 
una población más amplia. Además, la pericia se considera normalmente 
relacionada con un campo en el que estamos interesados. Como señala 
Sloboda, yo puedo convertirme en un experto en cruzar los brazos o en 
pronunciar mi propio nombre, pero no se otorga en general a eso la misma 
consideración que a convertirse, por ejemplo, en un experto en ajedrez o en 
reparación de Porsche, o a ser capaz de robar las joyas de la corona inglesa 
sin que te pesquen. 

El cuadro que aflora de esos estudios es que hacen falta diez mil horas 
de práctica para alcanzar el nivel de maestría asociado con ser un experto a 
escala mundial... en cualquier cosa. Este número aparece una y otra vez en 
un estudio tras otro, de compositores, jugadores de baloncesto, escritores de 
ficción, patinadores sobre hielo, pianistas de concierto, ajedrecistas, 
delincuentes expertos. Diez mil horas equivale aproximadamente a tres 
horas diarias, o veinte horas a la semana, de práctica a lo largo de diez años. 
Por supuesto, esto no explica por qué algunas personas no parecen llegar a 
ninguna parte cuando practican y por qué hay gente que saca más provecho 
de sus sesiones de práctica que otra. Pero nadie ha encontrado aún un caso 
en el que un auténtico experto a escala mundial consiga ese nivel en menos 
tiempo. Parece que el cerebro necesita esa práctica para asimilar todo lo que 
ha de saber para conseguir la maestría auténtica. 

La teoría de las diez mil horas coincide con lo que sabemos sobre cómo 
aprende el cerebro. El aprendizaje exige la asimilación y consolidación de 
información en el tejido neuronal. Cuantas más experiencias tenemos de 
algo más firme se hace la huella recuerdo/aprendizaje de esa experiencia. 
Aunque la gente difiera en el tiempo que tarda en consolidar neuronalmente 
información, sigue siendo cierto que el aumento de práctica significa un 


mayor número de huellas neuronales, que pueden combinarse para crear 
una representación mnemotécnica más fuerte. Esto es así ya se incline uno 
por la teoría de la huella múltiple o por cualquier número de variantes de 
teorías de la neuroanatomía de la memoria: la fuerza de un recuerdo está 
vinculada al número de veces que se ha experimentado el estímulo original. 

La fuerza del recuerdo depende también de cuánto nos interesemos por 
la experiencia. Etiquetas neuroquímicas asociadas con recuerdos los marcan 
según su importancia, y tendemos a codificar como cosas importantes 
aquellas que aportan mucha emoción, tanto positiva como negativa. Yo les 
digo a mis alumnos que si quieren hacer bien un examen, tienen que 
interesarse realmente por la materia cuando la estudian. El interés puede 
explicar, en parte, algunas de las diferencias iniciales que vemos en la 
rapidez con la que las personas adquieren nuevas habilidades. Si me gusta 
realmente una pieza concreta de música, querré practicarla más y, como me 
interesa, asignaré etiquetas neuroquímicas a cada aspecto del recuerdo que 
lo clasificarán como importante: los sonidos de la pieza, cómo muevo los 
dedos, si estoy tocando un instrumento de viento, cómo respiro...; todos 
esos elementos pasan a formar parte de una huella mnemotécnica que he 
catalogado como importante. 

Del mismo modo, si estoy tocando un instrumento que me gusta, y 
cuyos sonidos en sí me complacen, es más probable que preste atención a 
diferencias sutiles de tonalidad, y a cómo puedo moderar y modificar la 
tonalidad de mi instrumento. Estos factores tienen una importancia 
decisiva; el interés conduce a la atención, y juntos conducen a cambios 
neuroquímicos mensurables. Se libera dopamina, el neurotransmisor 
asociado con la regulación emocional, la alerta y el estado de ánimo, y el 
sistema dopaminérgico ayuda en la codificación de la huella mnemotécnica. 

Debido a factores diversos, algunas personas que reciben lecciones de 
música sienten menos motivación para practicar; su práctica es menos 
eficaz por factores motivacionales y de atención. El argumento de las diez 
mil horas es convincente porque aparece en un estudio tras otro en todos los 
campos. A los científicos les gusta el orden y la sencillez, así que si vemos 
un número o una fórmula que aparece en contextos distintos, tenderemos a 
favorecerlo como explicación. Pero la teoría de las diez mil horas, como 


muchas teorías científicas, tiene agujeros, y necesita rebatir argumentos en 
contra y refutaciones. 

La refutación clásica de la teoría de las diez mil horas es más o menos 
ésta: «Bueno, ¿y Mozart qué? ¡Tengo entendido que componía sinfonías a 
los cuatro años de edad! E incluso en el caso de que practicase cuarenta 
horas por semana desde el día en que nació, eso no serían diez mil horas». 
Primero, hay errores objetivos: Mozart no empezó a componer hasta los 
seis años de edad, y no escribió su primera sinfonía hasta los ocho. De 
todos modos, es excepcional, por decir poco, el que compusiese una 
sinfonía a los ocho años. Mozart demostró precocidad a una edad muy 
temprana. Pero eso no es lo mismo que ser un experto. Hay muchos niños 
que componen música, y algunos llegan a componer obras de envergadura 
con sólo ocho años de edad. Y Mozart estuvo sometido a una instrucción 
exhaustiva por parte de su padre, al que se consideraba generalmente en la 
época el mejor profesor de música de toda Europa. No sabemos cuánto 
practicó Mozart, pero si empezó a los dos años y trabajó veintidós horas por 
semana en ello (cosa muy posible, dada la fama que tenía su padre de duro, 
estricto y exigente como maestro), habría hecho sus diez mil horas a los 
ocho años. Aunque no hubiese practicado tanto, el argumento de las diez 
mil horas no dice que hagan falta diez mil horas para escribir una sinfonía. 
Es evidente que Mozart acabó convirtiéndose en un maestro, pero ¿la 
autoría de esa primera sinfonía lo cualifica como un experto, o alcanzó su 
nivel de maestría musical en una época posterior? 

John Hayes, de Carnegie Mellon, planteó esa misma pregunta. ¿La 
Sinfonía número 1 de Mozart puede considerarse la obra de un experto 
musical? Dicho de otro modo, si Mozart no hubiese escrito nada más, ¿nos 
parecería esa sinfonía la obra de un genio de la música? Tal vez no sea en 
realidad muy buena, y la única razón de que sepamos de ella es porque el 
niño que la escribió acabó convirtiéndose en Mozart: nos inspira un interés 
histórico, pero no un interés estético. Hayes estudió los programas de las 
principales orquestas y el catálogo de grabaciones comerciales, 
considerando que es más probable que se interpreten y graben las mejores 
composiciones musicales que las obras menores. Descubrió que las 
primeras Obras de Mozart no se interpretaban ni grababan muy a menudo. 


Los  .musicólogos las consideran principalmente curiosidades, 
composiciones que no predecían en modo alguno las obras maestras que 
habrían de seguir. Las composiciones de Mozart que se consideran 
verdaderamente grandes son las que compuso mucho después de que 
hubiese dedicado diez mil horas a hacerlo. 

Como hemos visto en los debates sobre memoria y categorización, la 
verdad se halla en algún punto situado entre los dos extremos, en una 
mezcla de las dos hipótesis que se enfrentan en el debate 
naturaleza/educación. Para entender cómo se produce esta síntesis y qué 
predicciones hace, necesitamos examinar con más detenimiento lo que 
pueden decir los genetistas. 

Los genetistas quieren encontrar un grupo de genes asociados con 
determinados rasgos observables. Suponen que si hay una aportación 
genética a la música, aparecerá en las familias, ya que hermanos y 
hermanas comparten el 50 por ciento de los genes. Pero puede ser difícil en 
este caso separar la influencia de los genes de la influencia del entorno. El 
entorno incluye el del vientre materno: los alimentos que ingiera la madre, 
si fuma o bebe, la cantidad de nutrientes y oxígeno que reciba el feto. Hasta 
los gemelos idénticos pueden tener entornos muy distintos, condicionados 
por el sitio de que disponen, su espacio para el movimiento y su posición. 

Es difícil diferenciar las influencias genéticas de las ambientales en una 
habilidad que tiene un componente de aprendizaje, como la música. La 
música tiende a ser cosa de familia. Pero es más probable que al hijo de 
músicos se le estimulen más sus tempranas tendencias musicales que al de 
un hogar no musical, y los hermanos de ese niño educado musicalmente es 
probable que reciban niveles similares de apoyo. Por analogía, los padres 
que hablan francés es probable que críen niños que hablen francés, y los 
que no probablemente no lo hagan. Podemos decir que hablar francés «es 
cosa de familia», pero no conozco a nadie que afirme que hablar francés sea 
algo genético. 

Una forma que tienen los científicos de determinar la base genética de 
rasgos O habilidades es estudiando gemelos idénticos, sobre todo aquellos 
que se han criado separados. El registro de gemelos de Minnesota, una base 
de datos mantenida por los psicólogos David Lykken, Thomas Bouchard y 


sus colegas, ha seguido a hermanos gemelos simples e idénticos educados 
separadamente y juntos. Dado que los hermanos gemelos comparten el 
cincuenta por ciento de su material genético y que los gemelos idénticos 
comparten el cien por cien, esto permite a los científicos diferenciar las 
influencias respectivas de la naturaleza y de la educación. Si algo tiene un 
componente genético, lo lógico sería que se presentase más a menudo en los 
individuos que son gemelos idénticos que en los que son sólo gemelos. 
Además, sería lógico esperar que apareciese incluso cuando los gemelos 
idénticos han sido educados en entornos completamente separados. Los 
genetistas conductuales buscan esas pautas y elaboran teorías sobre el 
carácter hereditario de ciertos rasgos. 

El enfoque más reciente examina las vinculaciones genéticas. Si un 
rasgo parece ser hereditario, podemos intentar aislar los genes que están 
vinculados a él. (No digo «responsable de ese rasgo», porque las 
interacciones entre genes son muy complicadas y no podemos decir con 
seguridad que un solo gen «cause» un rasgo.) Complica el asunto el hecho 
de que podemos tener un gen para algo sin que sea activo. No todos los 
genes que tenemos están «conectados», o expresados, todo el tiempo. 
Utilizando perfil de expresión de chip genético, podemos determinar qué 
genes son y qué genes no son los que están expresados en un momento 
dado. ¿Qué significa esto? Nuestros aproximadamente veinticinco mil 
genes controlan la síntesis de las proteínas que el cuerpo y el cerebro 
utilizan para realizar todas las funciones biológicas. Controlan el 
crecimiento del cabello, su color, la formación de fluidos digestivos y 
saliva, si acabamos midiendo uno ochenta de estatura o uno cincuenta. 
Durante el período en que se acelera el crecimiento, en torno a la pubertad, 
ha de haber algo que le diga al cuerpo que se ponga a crecer, y media 
docena de años más tarde algo que le diga que pare. Ese algo son los genes, 
que llevan instrucciones sobre qué es lo que hay que hacer y cómo hay que 
hacerlo. 

Utilizando el perfil de expresión de chip genético puedo analizar una 
muestra de tu ARN y (si sé lo que estoy buscando) puedo decir si tu gen del 
crecimiento está activo (es decir, expresado) en ese momento. Actualmente, 
el análisis de expresión genética no es viable en el cerebro porque las 


técnicas que existen (y que pueden preverse) exigen que analicemos un 
trozo de tejido cerebral. Esto a la mayoría de la gente le resulta 
desagradable. 

Los científicos que han estudiado a gemelos idénticos que se han 
educado separadamente han hallado similitudes notables. En algunos casos, 
los gemelos fueron separados al nacer, y no se informó siquiera a ninguno 
de ellos de la existencia del otro. Podían haber sido criados en entornos que 
diferían muchísimo geográficamente (Maine frente a Texas, Nebraska 
frente a Nueva York), en medios económicos y en valores religiosos o 
culturales de otro tipo. Al investigarlos veinte o más años más tarde, 
afloraron muchas similitudes asombrosas. A una mujer le gustaba ir a la 
playa y cuando lo hacía, entraba de espaldas en el agua; su hermano gemelo 
(al que no había conocido) hacía exactamente lo mismo. Un hombre se 
ganaba la vida vendiendo seguros, cantaba en el coro de la iglesia y llevaba 
hebillas de cinturón de cerveza Lone Star; lo mismo hacía su gemelo 
idéntico completamente separado de él desde el nacimiento. Estudios 
semejantes sugieren que la musicalidad, la religiosidad y la delincuencia 
tienen un fuerte componente genético. ¿Cómo podrían explicarse si no tales 
coincidencias? 

Una explicación alternativa es estadística y puede formularse así: «Si te 
esfuerzas lo suficiente en buscar y haces suficientes comparaciones, 
encontrarás algunas coincidencias que resultan muy extrañas pero que en 
realidad no significan nada». Toma dos personas al azar en la calle que no 
tengan ninguna relación entre ellas, salvo quizás a través de sus ancestros 
comunes Adán y Eva. Si te fijas en un número suficiente de rasgos, tendrás 
que encontrar algunos en común que no son obvios. No estoy hablando de 
cosas como «¡oh Dios mío! ¡¡También tú respiras aire!!», sino de cosas 
como «Yo me lavo la cabeza los martes y los viernes y utilizo un champú de 
hierbas los martes y me froto el pelo sólo con la mano izquierda y no uso 
acondicionador. Los viernes utilizo un champú australiano que tiene un 
acondicionador incorporado. Después, leo The New Yorker mientras 
escucho a Puccini». Historias como ésas parecen indicar que hay una 
conexión subyacente entre esas personas, a pesar de las seguridades de los 
científicos de que sus genes y su entorno son completamente distintos. Pero 


todos diferimos entre nosotros de miles y miles de formas diferentes y todos 
tenemos nuestras peculiaridades. De cuando en cuando encontramos 
coincidencias y nos sorprendemos. Sin embargo, desde un punto de vista 
estadístico, eso no es más sorprendente que si yo pienso en un número entre 
el uno y el cien y tú lo adivinas. Puedes no adivinarlo la primera vez, pero 
si jugamos ese juego el tiempo suficiente, acabarás adivinándolo de vez en 
cuando (un uno por ciento de las veces, para ser exactos). 

Una segunda explicación alternativa es psicológico-social: el aspecto 
que uno tiene influye en cómo te tratan los otros (considerando genético el 
«aspecto»); el mundo actúa en general con un organismo de una forma 
determinada en función de su apariencia. Esta noción intuitiva tiene una 
rica tradición en la literatura, desde Cirano de Bergerac a Shrek: rechazados 
por gente a la que su aspecto exterior inspira repugnancia, rara vez tienen la 
posibilidad de mostrar su yo interno y su auténtica naturaleza. Rodeamos de 
un halo romántico en nuestra cultura historias como ésas y experimentamos 
un sentimiento trágico ante la persona buena que sufre por algo que no es 
culpa suya: su aspecto. Esto opera también a la inversa: la gente con buena 
apariencia tiende a ganar más dinero, a conseguir mejores trabajos y a 
declarar que es más feliz. Incluso independientemente de si uno se 
considera atractivo o no, su apariencia influye en cómo nos relacionamos 
con él. Alguien que haya nacido con rasgos faciales que asociamos a la 
honradez (ojos grandes, por ejemplo, con cejas arqueadas) es alguien en 
quien la gente tenderá a confiar. Es posible que mostremos más respeto 
hacia una persona alta que hacia una baja. Muchos de los incidentes que nos 
suceden en la vida están condicionados en cierta medida por cómo nos ven 
Otros. 

Así que no tiene nada de raro que gemelos idénticos puedan acabar 
teniendo personalidades, rasgos, hábitos o peculiaridades similares. Alguien 
con las cejas inclinadas hacia abajo podría parecer siempre furioso, y el 
mundo le tratará de ese modo. La gente se aprovechará de alguien que 
parezca desvalido; a alguien que parezca un matón es posible que le 
provoquen continuamente a pelear, y desarrollará con el tiempo una 
personalidad agresiva. Vemos operar este principio con determinados 
actores. Hugh Grant, Judge Reinhold, Tom Hanks y Adrien Brody tienen 


Caras de aspecto inocente; Grant, sin hacer nada, tiene aspecto de no haber 
roto un plato. Esta línea de razonamiento dice que algunas personas nacen 
con rasgos determinados, y sus personalidades se desarrollan en gran parte 
como un reflejo de su aspecto. Los genes están influyendo aquí en la 
personalidad, pero sólo de una forma indirecta y secundaria. 

No es difícil imaginar un argumento similar aplicado a los músicos, y en 
particular a los vocalistas. La voz de Doc Watson produce la impresión de 
sinceridad y absoluta inocencia; no sé si él es personalmente así, y a un 
cierto nivel no importa. Puede que se convirtiese en el artista de éxito que 
es debido a cómo reacciona la gente ante la voz con la que nació. No estoy 
hablando de nacer con (o adquirir) una «gran» voz, como la de Ella 
Fitzgerald o Plácido Domingo, estoy hablando de expresividad 
independientemente de si la voz en sí es un gran instrumento. A veces 
cuando canta Aimee Mann yo percibo los rasgos de una voz de niña 
pequeña, una inocencia innegable que me conmueve porque siento que ella 
está llegando hasta las profundidades de sí misma y confesando 
sentimientos que normalmente sólo se revelan a un amigo íntimo. Si ella 
pretende transmitir eso, o si siente de verdad eso, yo no lo sé, es posible que 
haya nacido con una cualidad vocal que haga que los que la oyen la invistan 
de esos sentimientos, esté experimentándolos ella o no. La esencia de la 
interpretación musical es, en el fondo, ser capaz de transmitir emoción. Si el 
artista la está sintiendo o si nació con la capacidad de hacer que parezca que 
la siente puede no tener importancia. 

No quiero decir con esto que los actores y los músicos a los que he 
mencionado no tengan que trabajar para hacer lo que hacen. No conozco 
ningún músico de éxito que no haya trabajado de firme para llegar donde 
está; no conozco a ninguno al que el éxito le haya caído del cielo. He 
conocido a muchos artistas de los que la prensa ha dicho que han triunfado 
«de la noche a la mañana», pero que en realidad se pasaron cinco o diez 
años esforzándose por conseguirlo. La genética es un punto de partida que 
puede influir en la personalidad o en la carrera, o en las cosas concretas que 
uno elige cuando emprende una carrera. "Tom Hanks es un gran actor, pero 
no es probable que consiga los mismos papeles que Arnold 
Schwarzenegger, debido principalmente a, diferencias de dotación genética. 


Schwarzenegger no nació con un cuerpo de culturista; trabajó muy duro con 
él, pero tenía una predisposición genética para ello. Del mismo modo, 
medir dos metros crea, una predisposición a convertirse en un jugador de 
baloncesto más que en un jockey. Pero no basta que alguien que mida dos 
metros se plante en la cancha: tiene que aprender a jugar y tiene que 
practicar durante años para convertirse en un experto. El tipo de cuerpo, que 
es algo mayoritariamente (aunque no exclusivamente) genético, crea 
predisposiciones para el baloncesto lo mismo que las crea para ser actor, 
bailarín y músico. 

Los músicos, como los atletas, los actores, los bailarines, los escultores 
y los pintores, utilizan el cuerpo además de la mente. El papel del cuerpo en 
el manejo de un instrumento musical o en el canto (menos, por supuesto, en 
la composición y en los arreglos) significa que las predisposiciones 
genéticas pueden contribuir notablemente a la elección de instrumentos que 
un músico pueda tocar bien... y así una persona decide convertirse en un 
músico. 

Cuando yo tenía seis años, vi a los Beatles en el programa de Ed 
Sullivan y, en lo que se ha convertido en un tópico para la gente de mi 
generación, decidí en ese mismo instante que quería tocar la guitarra. Mis 
padres, que eran de la vieja escuela, no veían la guitarra como un 
«instrumento serio» y me dijeron que en vez de la guitarra tocase el piano 
de la familia. Pero yo estaba loco por tocarla. Recortaba imágenes de 
guitarristas clásicos como Andrés Segovia de las revistas y las dejaba por la 
casa como quien no quiere la cosa. A los seis años, yo aún ceceaba; no me 
libré de ello hasta los diez años, cuando el logopeda del colegio me sacó 
embarazosamente de mi clase de cuarto y se pasó dos duros años (a tres 
horas por semana) enseñándome a cambiar la forma que tenía de decir la 
letra s. Yo alegaba que los Beatles tenían que ser zerios para compartir el 
escenario del programa de Ed Sullivan con artiztaz zerioz como Beverly 
Thills, Rodgers y Hammerthtein, y John Guielgud. Era incansable. 

En 1965, cuando tenía ocho años, la guitarra estaba por todas partes. 
San Francisco estaba a sólo ventitantos kilómetros de distancia, sentía la 
revolución cultural y musical en marcha, y la guitarra estaba en el centro de 
todo ello. A mis padres seguía sin entusiasmarles que yo tuviese guitarra, 


tal vez por su asociación con hippies y drogas, o quizás como consecuencia 
de que el año anterior no había practicado diligentemente con el piano. Yo 
insistía por entonces en que los Beatles habían estado ya en el programa de 
Ed Sullivan cuatro veces y mis padres al final medio transigieron, 
accediendo a pedir consejo a un amigo suyo. «Jack King toca la guitarra — 
le dijo mi madre una noche a mi padre durante la cena—. Podríamos 
preguntarle si cree que Danny tiene ya edad para poder empezar a dar 
lecciones de guitarra.» Jack, un viejo amigo de la universidad de mis 
padres, se dejó caer por nuestra casa un día cuando regresaba a la suya del 
trabajo. Su guitarra no sonaba igual que las que me habían hipnotizado en la 
radio y la televisión; era una guitarra clásica, no hecha para los oscuros 
acordes del rock and roll. Jack era un hombre alto con unas manos grandes 
y el pelo negro cortado a cepillo. Sostenía la guitarra en brazos como si 
estuviese acunando a un niño. Observé las pautas intrincadas de las vetas de 
la madera rodeando las curvas del instrumento. Nos tocó algo. No me dejó 
tocar la guitarra, en vez de eso me pidió que extendiera la mano y posó su 
palma en la mía. No me dijo nada ni me miró, pero le dijo a mi madre una 
cosa que sí oí claramente: «Tiene las manos demasiado pequeñas para la 
guitarra». 

Ahora sé que hay guitarras tamaño tres cuartos y hasta de la mitad del 
tamaño de una normal (hasta tengo una yo), y sé que Django Reinhardt, uno 
de los mejores guitarristas de todos los tiempos, tenía sólo dos dedos en la 
mano izquierda. Pero para un niño de ocho años, las palabras de los adultos 
pueden parecer indiscutibles. En 1966, cuando ya había crecido algo y los 
Beatles me estaban azuzando con los compases de guitarra eléctrica de 
«Help», yo estaba tocando el clarinete y feliz de poder al menos hacer 
música. Acabé comprando mi primera guitarra a los dieciséis años y con la 
práctica aprendí a tocarla razonablemente bien; el rock y el jazz que toco no 
exigen el largo alcance que exige la guitarra clásica. La primera canción 
que aprendí a tocar (en lo que se ha convertido en otro tópico para mi 
generación) fue «Stairway to Heaven» de Led Zeppelin (bueno, eran los 
años setenta). Algunas partes musicales que los guitarristas con manos más 
grandes pueden tocar sin problema me resultarán siempre difíciles, pero eso 
pasa con todos los instrumentos. En el bulevar Hollywood de Hollywood, 


California, han grabado en el cemento las huellas de sus manos algunos de 
los grandes músicos de rock. Me quedé sorprendido el verano pasado 
cuando puse las manos sobre la huella dejada por Jimmy Page (de Led 
Zeppelin), uno de mis guitarristas favoritos, y comprobé que sus manos no 
eran mayores que las mías. 

Hace unos cuantos años estreché la mano de Oscar Peterson, el gran 
pianista de jazz. Tenía las manos muy grandes; las manos más grandes que 
he estrechado en mi vida, el doble de grandes que las mías como mínimo. 
Inició su carrera tocando el piano stride («piano de zancada»), un estilo que 
se remonta a los años veinte y en que el pianista toca un bajo de octava con 
la izquierda y la melodía con la derecha. Para ser un buen pianista stride, 
tienes que llegar a ser capaz de alcanzar teclas que están muy separadas con 
un mínimo de movimiento de manos, ¡y Oscar puede conseguir una octava 
y media tremenda con una mano! Su estilo está relacionado con los tipos de 
acordes que es capaz de tocar, acordes que alguien con manos más 
pequeñas no podría. Si a Oscar Peterson le hubiesen obligado a tocar el 
violín de niño le habría resultado imposible con unas manos tan grandes; 
sus anchos dedos habrían hecho difícil tocar un semitono en el mástil 
relativamente pequeño del violín. 

Algunas personas tienen una predisposición biológica hacia 
instrumentos concretos, o hacia el canto. Puede haber también un grupo de 
genes que trabajen juntos para crear las dotes que uno ha de tener para 
convertirse en un músico de éxito: buena coordinación ojo-mano, control 
muscular, control motriz, tenacidad, paciencia, memoria para ciertos tipos 
de estructuras y pautas, un sentido del ritmo y de la sincronización. Uno 
tiene que tener esas cosas para ser un buen músico. Algunas de ellas son 
necesarias para ser bueno en cualquier cosa, sobre todo la resolución, la 
seguridad en uno mismo y la paciencia. 

Sabemos también que la gente de éxito ha tenido, en general, muchos 
más fracasos que la gente que no llega a alcanzarlo. Esto parece 
contradictorio. ¿Cómo podría la gente de éxito haber fracasado más a 
menudo que los demás? El fracaso es inevitable y a veces se produce al 
azar. Lo importante es lo que haces después del fracaso. La gente de éxito 
es constante y persistente. No abandonan. Desde el presidente de FedEx al 


novelista Jerzy Kosinsky, desde Van Gogh a Bill Clinton y a Fleetwood 
Mac, la gente de éxito ha tenido muchos, muchos fracasos, pero 
aprendieron de ellos y siguieron avanzando. Esta cualidad podría ser en 
parte innata, pero tienen que jugar también un papel factores ambientales. 
La mejor hipótesis que tienen los científicos actualmente sobre el papel 
de los genes y del entorno en las conductas cognitivas complejas es que 
Cada uno es responsable de aproximadamente el 50 por ciento de la historia. 
Los genes pueden transmitir una propensión a ser paciente, a tener una 
buena coordinación ojo-mano, o a ser apasionado, pero ciertos 
acontecimientos de la vida (acontecimientos de la vida en el sentido más 
amplio, no sólo tus experiencias y recuerdos conscientes, sino cómo te 
alimentaste y cómo se alimentó tu madre mientras estabas en su vientre) 
pueden influir en que una propensión genética se materialice o no. Traumas 
del período inicial de la vida, como la pérdida de un progenitor, o sufrir 
abusos físicos o emocionales, son sólo los ejemplos obvios de influencias 
del entorno que pueden hacer que una predisposición genética resulte 
estimulada o anulada. Debido a esta interacción, sólo podemos hacer 
predicciones sobre la conducta humana a escala de una población, no de un 
individuo. Dicho de otro modo, si sabes que alguien tiene una 
predisposición genética a delinquir, no puedes hacer predicciones sobre si 
va a acabar en la cárcel en los cinco años siguientes. Por otra parte, 
sabiendo que un centenar de personas tienen esa predisposición, podemos 
predecir que algún porcentaje de ellos probablemente acabará en la cárcel; 
simplemente no sabemos cuáles. Y algunos nunca se meterán en ningún lío. 
Lo mismo se aplica a los genes musicales que podamos encontrar algún 
día. Lo único que se puede decir es que es más probable que un grupo de 
personas con esos genes produzca músicos expertos, pero no podemos saber 
qué individuos se convertirán en expertos. Esto presupone, sin embargo, 
que seamos capaces de identificar las correlaciones genéticas de la pericia 
musical, y que podamos ponernos de acuerdo en lo que constituye la 
maestría musical. La maestría musical es algo más que técnica estricta. Oír 
música y disfrutar de ella, la memoria musical y cómo se relaciona con la 
música una persona son también aspectos de una mente musical y una 
personalidad musical. Deberíamos adoptar el enfoque más inclusivo posible 


en la identificación de la musicalidad, para no excluir a aquellos que, 
aunque musicales en el sentido amplio, tal vez no lo sean en un sentido 
técnico y estricto. Muchas de nuestras mentes musicales más preclaras no 
eran considerados expertos en un sentido técnico. Irving Berlin, uno de los 
compositores de más éxito del siglo xx, era un mal instrumentista y apenas 
sabía tocar el piano. 

Incluso entre los mejores músicos clásicos de élite, hay más en lo de ser 
un músico que tener una excelente técnica. Tanto Arthur Rubinstein como 
Vladimir Horowitz son considerados generalmente dos de los mejores 
pianistas del siglo xx y sin embargo cometieron errores (pequeños errores 
técnicos) con una frecuencia sorprendente. Una nota equivocada, una nota 
precipitada, una nota que no ha sido pulsada del modo correcto. Pero como 
escribió un crítico: «Rubinstein comete errores en algunas de sus 
grabaciones, pero yo prefiero esas interpretaciones que están llenas de 
pasión al mago técnico de veintidós años que es capaz de tocar las notas 
pero no es capaz de transmitir el sentido». 

Lo que la mayoría de nosotros buscamos en la música es una 
experiencia emotiva. No estamos estudiando la interpretación en busca de 
notas equivocadas y, mientras éstas no nos saquen de nuestro ensueño, la 
mayoría de nosotros ni siquiera las advertimos. Así que gran parte de la 
investigación sobre pericia musical ha buscado los logros en el lugar 
equivocado, en la facilidad de los dedos más que en la expresividad de la 
emoción. Hace poco le pregunté a la decana de una de las escuelas de 
música más importantes de Norteamérica sobre esta paradoja: ¿en qué 
punto del currículum se enseñan la emoción y la expresividad? Su respuesta 
fue que no se enseñan. «Hay tanto que abarcar en el programa aprobado — 
explicó—, repertorio, conjunto y solos, cantar y tocar repentizando, teoría 
de la música... que no hay sencillamente tiempo para enseñar 
expresividad.» ¿Cómo se consigue entonces que los músicos sean 
expresivos? «Algunos vienen ya sabiendo cómo conmover al auditorio. 
Normalmente lo han aprendido ellos mismos en algún momento de su 
trayectoria.» La sorpresa y la decepción se me debían de ver en la cara. «De 
vez en cuando —añadió, casi en un susurro—, si hay un alumno 
excepcional, se busca tiempo durante la última parte de su último semestre 


aquí para enseñarle a transmitir emoción... Normalmente se trata de 
alumnos que han actuado ya como solistas en nuestra orquesta, y les 
ayudamos a conseguir más expresividad en su interpretación.» Así que, en 
una de las mejores escuelas de música que tenemos, la razón de ser de la 
música es enseñar a una minoría selecta, y eso sólo en las últimas semanas 
de unos estudios de cuatro a cinco años. 

Hasta los individuos más serios y analíticos esperan que Shakespeare y 
Bach los conmuevan. Podemos maravillarmos de la destreza que estos 
genios han logrado, de su facilidad en el manejo del lenguaje o de las notas, 
pero en último término esa facilidad debe ponerse al servicio de un tipo 
diferente de comunicación. Los aficionados al jazz, por ejemplo, son 
especialmente exigentes con sus héroes del período posterior al de las 
grandes bandas, empezando por la era de Miles Davis, John Coltrane y Bill 
Evans. Decimos de los músicos de jazz menores que parecen distanciados 
de sus auténticos yos y de la emoción, que su interpretación no es nada más 
que «shucking and jiving» (cuentos y pamplinas), tentativas de complacer al 
público con exequias musicales sin alma. 

Así pues, en un sentido científico, ¿por qué son algunos músicos 
superiores a otros no en la dimensión técnica de la música sino en la 
emocional? Éste es el gran misterio y nadie sabe en realidad por qué. Los 
músicos aún no han interpretado con sentimiento dentro de los escáneres 
cerebrales, debido a problemas técnicos. (Los escáneres que utilizamos 
actualmente exigen que el sujeto permanezca completamente inmóvil, para 
que no se desdibuje la imagen del cerebro; esto puede cambiar en los 
próximos cinco años.) Las entrevistas y entradas de diarios de músicos que 
van desde Beethoven y Tchaikovsky hasta Rubinstein y Bernstein, B. B. 
King y Stevie Wonder parecen indicar que en la tarea de comunicar 
emoción participan factores mecánicos y técnicos y además algo que sigue 
siendo misterioso. 

El pianista Alfred Brendel dice que él no piensa en notas cuando está en 
el escenario; piensa en crear una experiencia. Stevie Wonder me contó en 
1996 que él cuando está actuando intenta situarse en el mismo marco 
mental y en el mismo «marco del corazón» en que estaba cuando escribió la 
canción; se esfuerza por evocar las mismas sensaciones y el mismo 


sentimiento, y eso le ayuda en la interpretación. En qué sentido influye esto 
en su forma diferente de cantar o de tocar es algo que nadie sabe. Desde una 
perspectiva neurocientífica, sin embargo, todo eso tiene mucho sentido. 
Como hemos visto, recordar la música entraña volver a poner las neuronas 
que estuvieron activas originalmente en la percepción de una pieza de 
música en su estado original, reactivando su pauta concreta de conectividad 
y logrando unos índices de activación lo más próximo posible a sus niveles 
originales. Esto significa reclutar neuronas en el hipocampo, la amígdala y 
los lóbulos temporales en una sinfonía neuronal orquestada por los centros 
de planificación y atención del lóbulo frontal. 

El neuroanatomista Andrew Arthur Abbie especuló en 1934 sobre un 
vínculo entre el movimiento, el cerebro y la música que no ha llegado a 
demostrarse hasta hoy. Según él, las vías que van del tallo cerebral y el 
cerebelo a los lóbulos frontales son capaces de tejer toda la experiencia 
sensorial y de coordinar con precisión los movimientos musculares en un 
«tejido homogéneo» y que cuando eso ocurre, el resultado son «los 
máximos poderes del hombre tal como se expresan... en el arte». Creía que 
esa vía neuronal estaba dedicada a movimientos motrices que incorporan o 
reflejan un propósito creador. Nuevos estudios de Marcelo Wanderley de 
McGill, y de mi antiguo alumno de doctorado Bradley Vines (ahora en 
Harvard) han demostrado que los oyentes no músicos son exquisitamente 
sensibles a los gestos físicos que hacen los músicos. Observando una 
interpretación musical con el sonido apagado, y atendiendo a cosas como 
los movimientos del brazo, el hombro y el torso del músico, los oyentes 
ordinarios pueden detectar una gran cantidad de intenciones expresivas de 
éste. Si se añade el sonido, aparece una cualidad emergente: una 
comprensión de las intenciones expresivas del músico que va más allá de lo 
que es asequible sólo en el sonido o sólo en la imagen visual. 

Si la música sirve para transmitir sentimientos a través de la interacción 
de gestos físicos y sonido, el músico necesita que su estado cerebral se 
corresponda con el estado emotivo que está intentando expresar. Aunque 
aún no se hayan hecho estudios, estoy dispuesto a apostar que cuando B. B. 
King está tocando el blues y cuando lo está sintiendo, las firmas neuronales 
son muy parecidas. (También habrá diferencias, claro, y parte del obstáculo 


científico será sustraer los procesos vinculados a la emisión de órdenes 
motrices y a la audición de la música, del de simplemente estar sentado, con 
la cabeza apoyada en las manos, sintiendo.) Y como oyentes, hay todas las 
razones para creer que algo de nuestros estados cerebrales coincidirá con 
los de los músicos a los que estamos escuchando. En lo que es un tema 
recurrente de este libro, hasta los que carecen de formación explícita en 
interpretación y teoría de la música tienen cerebros musicales y son oyentes 
expertos. 

Para entender la base neuroconductual de la pericia musical y por qué 
algunas personas se convierten en mejores intérpretes que otras, hemos de 
tener en cuenta que la pericia musical adopta muchas formas, a veces 
técnicas (que afectan a la destreza) y a veces emotivas. La capacidad de 
arrastrarnos con una interpretación de manera que olvidemos todo lo demás 
es también un tipo especial de habilidad. Muchos intérpretes tienen un 
magnetismo personal, o carisma, que es independiente de cualquier otra 
habilidad que puedan o no tener. Cuando Sting está cantando no podemos 
apartar el oído de él. Cuando Miles Davis está tocando la trompeta, o Eric 
Clapton la guitarra, parece arrastrarnos hacia él una fuerza invisible. Esto 
no tiene mucho que ver con las notas concretas que están cantando oO 
tocando, son muchos los buenos músicos que pueden tocar o cantar esas 
notas, tal vez incluso con mayor facilidad técnica. Es, más bien, lo que los 
ejecutivos de las discográficas llaman «cualidad de estrella». Cuando 
decimos de una modelo que es fotogénica, estamos hablando de cómo se 
manifiesta esa cualidad de estrella en las fotos. Lo mismo sucede con los 
músicos, y en cómo se manifiesta esa cualidad suya en las grabaciones. Yo 
la llamo fonogénica. 

También es importante diferenciar celebridad de pericia. Los factores 
que contribuyen a la celebridad podrían ser diferentes de los que 
contribuyen a la pericia, tal vez hasta no tener absolutamente ninguna 
relación con ellos. Neil Young me explicó que él no consideraba que tuviese 
un talento muy especial como músico, sino que era más bien uno de los 
afortunados que conseguían alcanzar el éxito comercial. Pocas personas 
llegan a pasar el molinete de un contrato con una discográfica importante y 
menos aún los que consiguen mantenerse décadas en la carrera profesional 


como ha hecho Neil. Pero él, como Stevie Wonder y Eric Clapton, atribuye 
gran parte de su éxito no a una pericia musical, sino a una buena 
oportunidad. Paul Simon está de acuerdo con eso. «He tenido la suerte de 
poder trabajar con algunos de los músicos más asombrosos del mundo — 
dijo— y la mayoría de ellos son gente de la que nadie ha oído hablar.» 


Francis Crick convirtió su falta de formación en un aspecto positivo del 
trabajo de su vida. Sin el peso del dogma científico, se sintió libre 
(completamente libre, escribió) para abrir su mente y descubrir la ciencia. 
Cuando un artista aporta esta libertad, esta tabula rasa a la música, los 
resultados pueden ser asombrosos. Muchos de los mejores músicos de 
nuestra época carecían de formación oficial, entre ellos Sinatra, Louis 
Armstrong, John Coltrane, Eric Clapton, Eddie Van Halen, Stevie Wonder y 
Joni Mitchell. Y en música clásica, George Gershwin, Mussorgsky y David 
Helfgott figuran entre los que carecían de formación, y Beethoven, según 
sus diarios, consideraba que su propia formación había sido pobre. 

Joni Mitchell había cantado en coros en la escuela pública, pero no 
había dado nunca lecciones de guitarra ni ningún otro tipo de lecciones de 
música. Su música tiene una cualidad única que se ha descrito de muchos 
modos, se ha dicho que es de vanguardia, etérea y que tiende puentes entre 
la música clásica, la popular, el jazz y el rock. Utiliza muchas afinaciones 
alternas, es decir, en vez de afinar la guitarra de la forma acostumbrada, 
afina las cuerdas a tonos de su propia elección. Eso no significa que toque 
notas que otra gente no toca (aún hay sólo doce notas en una escala 
cromática) sino que significa que puede llegar con facilidad con los dedos a 
hacer combinaciones de notas que otros guitarristas no pueden hacer 
(independientemente del tamaño de sus manos). 

Una diferencia aún más importante es la relacionada con la forma en 
que la guitarra hace el sonido. Cada una de las seis cuerdas está afinada a 
una altura de tono determinada. Cuando un guitarrista quiere uno distinto, 
por supuesto, aprieta una o más cuerdas contra el mástil; esto acorta la 
cuerda, lo que hace que vibre más rápido, y que la nota tenga un tono más 
agudo. Una cuerda sobre la que se presiona («trasteada») tiene un sonido 
diferente de la que no se presiona, debido a un leve amortiguamiento del 


sonido que emite provocado por el dedo; las cuerdas no trasteadas O 
«libres» tienen una cualidad más clara, más resonante, y seguirán sonando 
más tiempo que las trasteadas. Cuando se dejan sonar juntas dos o más de 
esas cuerdas libres, emerge un timbre único. Joni, reafinando, cambiaba la 
configuración de las notas pulsadas cuando una cuerda está libre, de modo 
que oímos resonar notas que normalmente no suenan en la guitarra y en 
combinaciones que no solemos oír. Puedes comprobarlo en sus canciones 
«Chelsea Morning» y «Refuge of the Roads», por ejemplo. 

Pero hay algo más que eso en el asunto: hay muchos guitarristas que 
tienen afinaciones propias, como por ejemplo David Crosby, Ry Cooder, 
Leo Kottke y Jimmy Page. Una noche que estaba cenando con Joni en Los 
Ángeles ella empezó a hablarme de bajistas con los que había trabajado. 
Había trabajado con algunos de los mejores de nuestra generación: Jaco 
Pastorius, Max Bennett, Larry Klein, y escribió un álbum entero con 
Charles Mingus. Joni es capaz de hablar horas, convincente y 
apasionadamente, sobre afinaciones alternadas, comparándolas a los 
diferentes colores que utilizaba Van Gogh en sus cuadros. 

Mientras esperábamos el plato principal, me explicó la historia de cómo 
Jaco Pastorius siempre discutía con ella, desafiándola y armando gresca en 
general entre bastidores antes de que salieran a actuar. Por ejemplo, cuando 
la empresa Roland le entregó en mano a Joni el primer amplificador de coro 
de jazz Roland para que lo usara en una actuación, Jaco cogió y se lo llevó a 
su rincón del escenario. «Es mío», gruñó. Cuando Joni se acercó a él, le 
lanzó una mirada feroz. Y no hubo nada que hacer. 

Llevábamos ya lo menos veinte minutos de historias de bajistas. Como 
yo era un gran fan de Jaco cuando tocaba con Weather Report, la interrumpí 
y le pregunté cómo era musicalmente lo de tocar con él. Me dijo que era 
distinto a todos los demás bajos con que había tocado en su vida; que era el 
único hasta entonces con el que que tenía realmente la sensación de que 
entendía lo que ella estaba intentando hacer. Por eso era por lo que 
aguantaba todos sus comportamientos agresivos. 

«Cuando yo empecé —dijo—, la discográfica quería asignarme un 
productor, alguien que tuviese experiencia sacando discos de gran éxito. 
Pero [David] Crosby dijo: “No les dejes: un productor te destruirá. Diles 


que te lo produciré yo; confiarán en mí”. Así que básicamente Crosby puso 
su nombre como productor para apartar de mi camino a la discográfica y 
que pudiese hacer la música del modo que yo quería hacerla. 

»Pero luego llegaron los músicos y todos tenían su idea de cómo 
querían tocar. ¡En mi disco! Los peores eran los bajistas, porque siempre 
querían saber cuál era la raíz del acorde.» 

La «raíz» de un acorde, en teoría de la música, es esa nota por la que se 
nombra el acorde y en la que se basa. Un acorde en «do mayor», por 
ejemplo, tiene la nota do como raíz y uno en «mi bemol menor» la nota mi 
bemol. Es así de simple. Pero los acordes que toca Joni, como consecuencia 
de su composición única y de su forma de tocar la guitarra, no son acordes 
típicos: Joni lanza notas juntas de una manera que hace que no resulte fácil 
etiquetar los acordes. 

«Los bajistas querían saber la raíz porque era así como les habían 
enseñado a tocar. Pero yo dije: “Tocad sólo algo que suene bien, no os 
preocupéis de cuál es la raíz”. Y ellos dijeron: “Nosotros no podemos hacer 
eso..., tenemos que tocar la raíz porque si no no sonará bien”.» 

Como Joni no había estudiado teoría de la música y no sabía leer 
música, no podía decirles cuál era la raíz. Tenía que decirles qué notas 
estaba tocando en la guitarra, una a una, y ellos tenían que deducir por su 
cuenta, laboriosamente, un acorde cada vez. Pero aquí es donde chocan en 
una conflagración explosiva la psicoacústica y la teoría de la música: los 
acordes estándard que usan la mayoría de los compositores (do mayor, mi 
bemol menor, re séptima, etc.) no dejan lugar a la ambigúedad. Ningún 
músico competente necesitaría preguntar cuál es la raíz de un acorde así; es 
evidente, y sólo hay una posibilidad. El genio de Joni consiste en que ella 
quería acordes que eran ambiguos, acordes que podrían tener dos o más 
raíces diferentes. Cuando no hay ningún bajista acompañando su guitarra 
(como en «Chelsea Morning» o «Sweet Bird»), el oyente se queda en un 
estado de posibilidades estéticas en expansión. Como cada acorde podría 
interpretarse de dos o más modos diferentes, cualquier predicción o 
expectativa que tenga un oyente sobre lo que viene a continuación se basa 
menos en la certidumbre que con los acordes tradicionales. Y cuando Joni 
pulsa juntos varios de esos acordes ambiguos, la complejidad armónica 


aumenta notablemente. Y cada progresión de acordes puede interpretarse de 
docenas de formas distintas, según cómo se oiga cada uno de los que la 
constituyen. Como mantenemos en la memoria inmediata lo que acabamos 
de oír y lo integramos con el flujo de nueva música que nos llega a los 
oídos y al cerebro, los oyentes atentos a la música de Joni (incluso los no 
músicos) pueden escribir y reescribir en sus mentes una multitud de 
interpretaciones musicales mientras la pieza se va desplegando, y cada 
nueva audición aporta una nueva serie de contextos, expectativas e 
interpretaciones. En este sentido, la música de Joni es la que está más 
próxima al arte visual impresionista de todas las que yo haya podido oír. 

En cuanto un bajo toca una nota, fija una interpretación musical 
determinada, destruyendo así la delicada ambigúedad que tan 
habilidosamente ha construido el compositor. Todos los bajistas con los que 
trabajó Joni antes de Jaco insistían en tocar raíces, o lo que ellos creían que 
eran raíces. La brillantez de Jaco consistía, dijo Joni, en que sabía 
instintivamente vagar por el espacio de posibilidades, reforzando las 
diferentes interpretaciones de acordes con el mismo énfasis, manteniendo 
de forma sublime la ambigitedad en un delicado equilibrio suspendido. Jaco 
permitía a Joni tener bajo eléctrico en sus canciones sin destruir una de sus 
cualidades más expansivas. Esto era, pues, dedujimos en la cena de aquella 
noche, uno de los secretos de por qué la música de Joni tiene un sonido 
distinto a todas las demás: su complejidad armónica debida a su insistencia 
rigurosa en que la música no esté anclada en una interpretación armónica 
única. Al añadir a eso su voz fonogénica y persuasiva nos sentimos 
inmersos en un mundo auditivo, un paisaje sonoro distinto a cualquier otro. 


La memoria musical es otro aspecto de la pericia musical. Muchos de 
nosotros conocemos a alguien que recuerda todo tipo de detalles que el 
resto no podemos recordar. Podría tratarse de un amigo que recuerda todos 
los chistes que ha oído en su vida, mientras otros no podemos siquiera 
repetir uno que hemos oído ese mismo día. Mi colega Richard Parncutt, un 
conocido musicólogo y profesor de cognición musical de la Universidad de 
Graz de Viena, solía tocar el piano en una taberna para ganar dinero para 
estudiar. Siempre que viene a verme a Montreal se sienta al piano en mi 


salón y me acompaña mientras yo canto. Podemos tocar juntos mucho 
tiempo: es capaz de tocar de memoria cualquier canción que le nombre. 
Conoce también las diferentes versiones de las canciones: si le pido que 
toque «Anything Goes», me preguntará si quiero una versión de Sinatra, la 
de Ella Fitzgerald o la de Count Basie. Yo, por mi parte, probablemente 
pueda cantar o tocar un centenar de canciones de memoria. Esto es típico de 
alguien que ha tocado en bandas u orquestas, y ha cantado. Pero Richard 
parece conocer miles y miles de canciones, tanto los acordes como las 
letras. ¿Cómo lo hace? ¿Es posible que simples mortales como yo aprendan 
también todo eso de memoria? 

Cuando yo estaba en la escuela de música, en el Berklee College de 
Boston, conocí a alguien con un tipo de memoria musical igual de notable, 
pero diferente de la de Richard. Carla era capaz de reconocer una pieza de 
música en sólo tres o cuatro segundos y nombrarla. No sé en realidad lo 
buena que era cantando canciones de memoria, porque siempre estábamos 
ocupados intentando dar con una melodía que no fuese capaz de identificar, 
y era difícil de conseguir. Acabó trabajando en la Asociación 
Estadounidense de Compositores y Editores (ASCAP, según sus siglas en 
inglés), una organización de los compositores que controla la música que 
emiten las estaciones de radio para recaudar los derechos de autor de sus 
miembros. Los empleados de esta asociación están todo el día sentados en 
una sala de Manhattan escuchando pasajes de programas de radio de todo el 
país. Para ser eficientes en su tarea, y en primer lugar para que los 
contraten, tienen que ser capaces de identificar una canción y al intérprete 
en sólo tres o cuatro segundos para anotarla en el diario y pasar a la 
siguiente. 

Mencioné ya antes a Kenny, el chico con el síndrome de Williams que 
toca el clarinete. Una vez que estaba tocando «The Entertainer» (el tema 
musical de The Sting), de Scott Joplin, tenía problemas con cierto pasaje. 
«¿Puedo intentar eso de nuevo?», me preguntó, con un afán de complacer 
que es típico del síndrome de Williams. «Por supuesto», dije. Pero, en vez 
de volver atrás sólo unas cuantas notas o unos cuantos segundos de la pieza, 
¡empezó otra vez desde el principio! Yo había visto eso antes, en los 
estudios de grabación, con grandes músicos, desde Carlos Santana a los 


Clash: una tendencia a volver atrás, si no al principio de toda la pieza, al 
principio de una frase. Es como si el músico estuviese ejecutando una 
secuencia memorizada de movimientos musculares y la secuencia tuviese 
que empezar desde el principio. 

¿Qué tienen en común estas tres demostraciones de memoria para la 
música? ¿Qué pasa en el cerebro de alguien con una memoria musical 
fantástica como Richard y Carla, o con la «memoria digital» que tiene 
Kenny? ¿En qué podrían ser diferentes esas operaciones de los procesos 
neuronales ordinarios de alguien con una simple memoria musical media, o 
en qué podrían parecerse? La pericia en cualquier campo se caracteriza por 
una memoria superior, pero sólo para cosas incluidas dentro del campo de 
esa pericia. Mi amigo Richard no tiene una memoria superior para todo en 
la vida..., pierde las llaves exactamente igual que cualquier otro. Los 
grandes ajedrecistas han memorizado miles de configuraciones de juego y 
tablero. Sin embargo, su memoria excepcional para el ajedrez no abarca 
más que las posiciones legales de las piezas del ajedrez. Si se les pide que 
memoricen distribuciones al azar de piezas en un tablero, no lo harán mejor 
que los novicios; en otras palabras, su conocimiento de las posiciones de las 
piezas de ajedrez está esquematizado y se basa en el conocimiento de los 
movimientos y posiciones legales que pueden tener esas piezas. Y los 
expertos en música se basan también en su conocimiento de la estructura 
musical. Destacan recordando series de acordes que son «legítimos» o que 
tienen sentido dentro de sistemas armónicos de los que ellos tienen 
experiencia, pero no son mejores que los demás aprendiendo series de 
acordes al azar. 

Cuando los músicos memorizan canciones se basan, pues, para hacerlo 
en una estructura y los detalles encajan en esa estructura. Se trata de una 
forma eficiente y frugal que tiene el cerebro de funcionar. En vez de 
memorizar cada acorde o cada nota, construimos una estructura dentro de la 
cual pueden encajar diferentes sonidos, una plantilla mental que puede 
incluir gran número de piezas musicales. Cuando el pianista aprende a tocar 
la Sonata «Patética» de Beethoven, puede aprender las primeras ocho 
medidas y luego, para las ocho siguientes, sólo necesita saber que se repite 
el mismo tema pero una octava más alta. Un músico de rock puede tocar 


«One After 909» de los Beatles aunque no la haya tocado nunca antes, sólo 
con que se le diga que es una «progresión de acordes estándar de dieciséis 
compases de blues». Esa frase es una estructura dentro de la cual encajan 
miles de canciones. «One After 909» tiene ciertos matices que constituyen 
variaciones de la estructura. La cuestión es que los músicos no suelen 
aprender nuevas piezas nota a nota una vez que han llegado a un cierto 
nivel de experiencia, conocimiento y pericia. Pueden apoyarse en las piezas 
previas que conocen y limitarse a anotar las variaciones que pueda haber 
respecto al esquema estándar. 

La memoria para interpretar una pieza musical entraña un proceso muy 
parecido al de escuchar música tal como vimos en el capítulo 4, a través de 
establecer esquemas estándar y expectación. Además, los músicos utilizan 
el troceo, una forma de organizar información parecida a cómo organizan la 
información los ajedrecistas, los atletas y otros expertos. «Trocear» consiste 
en un proceso de ligar unidades de información en grupos, y recordar el 
grupo como un todo en vez de las piezas individuales. Hacemos esto 
continuamente sin tener mucha conciencia de ello cuando tenemos que 
recordar el número de teléfono de alguien. Si estás intentando recordar el 
número de teléfono de alguien de la ciudad de Nueva York y conoces otros 
números de teléfono de esa ciudad y estás familiarizado con ellos, no 
tendrás ya que recordar el código de zona como tres números individuales, 
lo recordarás más bien como una unidad: 212. También puedes saber que el 
de Los Ángeles es 213, el de Atlanta es 404, o que el código de país de 
Inglaterra es 44. La razón de que trocear sea importante es que nuestros 
cerebros tienen límites en cuanto a la cantidad de información que pueden 
rastrear activamente. No hay ningún límite práctico para la memoria a largo 
plazo que sepamos, pero la memoria de trabajo (los contenidos de nuestra 
conciencia presente) están rigurosamente limitados, en general a nueve 
piezas de información. Codificar un número de teléfono norteamericano 
como el código de zona (una unidad de información) más siete dígitos nos 
ayuda a eludir ese límite. Los ajedrecistas utilizan también el troceo, 
recordando configuraciones del tablero en forma de grupos de piezas 
distribuidas en pautas estándar fáciles de nombrar. 


Los músicos también utilizan el troceo de varios modos. Primero, 
tienden a codificar en la memoria un acorde completo, en vez de las notas 
individuales del acorde; recuerdan «do mayor 7» en lugar de las notas 
individuales do-mi-sol-si, y recuerdan la regla para construir acordes, de 
manera que puedan crear esas cuatro notas sobre la marcha con sólo una 
entrada en la memoria. Segundo, los músicos tienden a codificar secuencias 
de acordes, en vez de acordes aislados. «Cadencia plagal», «cadencia 
eólica», «doce barras de blues menor con un cambio V-D» o «cambios de 
ritmo» son etiquetas taquigráficas que utilizan los músicos para describir 
secuencias de diversas longitudes. El tener almacenada la información de lo 
que significan esas etiquetas permite al músico recordar grandes trozos de 
información de una sola entrada mnemotécnica. Tercero, obtenemos 
conocimiento como oyentes sobre normas estilísticas y como intérpretes 
sobre cómo producir esas normas. Los músicos saben cómo coger una 
canción y aplicar ese conocimiento (esquemas de nuevo) para hacer que 
suene como salsa o grunge o disco o heavy metal; cada género y época 
tiene tics estilísticos o elementos rítmicos, tímbricos o armónicos 
característicos que los definen. Podemos codificarlos en la memoria 
holísticamente y recuperarlos luego todos de una vez. 

Estas tres formas de trocear son lo que Richard Parncutt utiliza cuando 
se sienta al piano para tocar miles de canciones. Sabe también bastante 
teoría de la música y tiene un conocimiento suficiente de los diferentes 
estilos y géneros como para sortear mediante un apaño un pasaje que en 
realidad no conoce, igual que un actor podría sustituir palabras que no están 
en el guión si momentáneamente se olvida de lo que tiene que decir. Si 
Richard no está seguro de una nota o un acorde, hará uso de otra u otro que 
resulte estilísticamente plausible. 

La memoria de identificación (la capacidad que la mayoría de nosotros 
tenemos para identificar piezas de música que hemos oído antes) es similar 
a la memoria de rostros, fotos, incluso gustos y olores, y hay variabilidad 
individual; simplemente unas personas son mejores que otras; es también 
específica de dominio, de modo que algunas (como mi compañera de clase 
Carla) son especialmente buenas en música, mientras que otras sobresalen 
en otros dominios sensoriales. Ser capaz de recuperar rápidamente una 


pieza familiar de música de la memoria es una habilidad, pero ser capaz de 
adjudicarle luego enseguida y sin esfuerzo una etiqueta, como el título de la 
canción, el artista y el año de grabación (cosa que Carla podía hacer) 
implica a una red cortical diferente, que creemos ahora que incluye el 
planum temporale (una estructura asociada con el oído absoluto) y regiones 
en el córtex prefrontal inferior que sabemos que son necesarias para 
adjudicar etiquetas verbales a impresiones sensoriales. Aún no sabemos por 
qué unas personas son mejores en esto que otras, pero puede deberse a 
predisposición innata o integrada en el proceso de formación de sus 
cerebros, y esto puede tener a su vez en parte una base genética. 

Los músicos, cuando aprenden secuencias de notas en una nueva pieza 
musical, tienen que recurrir a veces al enfoque de fuerza bruta que 
adoptamos la mayoría de nosotros de niños para aprender nuevas 
secuencias de sonidos, como el alfabeto o el padrenuestro. Simplemente 
hacemos todo lo posible para memorizar la información repitiéndola una y 
otra vez. Pero esta memorización mecánica se facilita enormemente con una 
organización jerárquica del material. Ciertas palabras de un texto o ciertas 
notas de una pieza musical (como vimos en el capítulo 4) son 
estructuralmente más importantes que otras, y organizamos nuestro 
aprendizaje en torno a ellas. Este tipo de vieja y sencilla memorización es lo 
que hacen los músicos cuando aprenden los movimientos musculares 
necesarios para tocar una pieza determinada; es parte de la razón de que 
músicos como Kenny no puedan empezar a tocar justo en cualquier nota, 
sino que tiendan a ir al principio de unidades significativas, el principio de 
sus trozos jerárquicamente organizados. 


Ser un músico experto adopta así muchas formas: destreza tocando un 
instrumento, comunicación emotiva, creatividad y estructuras mentales 
especiales para recordar la música. Ser un oyente experto, cosa que la 
mayoría de nosotros somos a los seis años de edad, entraña haber 
incorporado la gramática de nuestra cultura musical en esquemas mentales 
que nos permitan formar expectativas musicales, la esencia de la 
experiencia estética de la música. Aún sigue siendo un misterio 
neurocientífico cómo se adquieren todas esas formas diversas de pericia. 


Pero el consenso emergente es que la pericia musical no es algo individual, 
sino que incluye muchos componentes, y no todos los expertos musicales 
estarán dotados por igual de estos diversos componentes: algunos, como 
Irving Berlin, pueden carecer de lo que la mayoría de nosotros 
consideraríamos incluso un aspecto fundamental de la condición de músico, 
y no son capaces de tocar bien un instrumento. Parece improbable por lo 
que ya sabemos que la pericia musical sea completamente distinta de la 
pericia en otros campos. Aunque la música por supuesto emplea estructuras 
cerebrales y circuitos neuronales que otras actividades no utilizan, los 
procesos para convertirse en un experto musical (ya sea un compositor o un 
intérprete) exigen muchos de los mismos rasgos de personalidad que son 
necesarios para llegar a ser un experto en otros campos, sobre todo 
diligencia, paciencia, motivación y la simple y anticuada constancia. 

Convertirse en un músico famoso es otra cuestión completamente 
distinta, y puede no tener tanto que ver con factores intrínsecos o con la 
habilidad como con el carisma, la oportunidad y la suerte. Pero un aspecto 
esencial es el que corresponde a la repetición. Todos somos oyentes 
musicales expertos, capaces de tomar decisiones muy sutiles sobre lo que 
nos gusta y lo que no nos gusta, aunque seamos incapaces de explicar la 
razón. La ciencia tiene algo que decir sobre por qué nos gusta la música que 
nos gusta, y esa historia es otra faceta interesante de la interacción entre las 
neuronas y las notas. 
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MIS COSAS FAVORITAS 


¿POR QUÉ NOS GUSTA LA MÚSICA QUE NOS GUSTA? 


Despiertas de un sueño profundo y abres los ojos. El batir lejano y regular 
de la periferia de tu audición aún está allí. "Te frotas los ojos con las manos, 
pero no puedes distinguir contornos y formas. Pasa el tiempo, pero ¿cuánto? 
¿Media hora? ¿Una hora? Luego oyes un sonido distinto pero identificable: 
un sonido serpenteante, móvil, amorfo, con un ritmo rápido, un batir que 
puedes sentir en los pies. Los sonidos comienzan y cesan sin definición. 
Creciendo y decreciendo gradualmente, se entretejen sin principios ni fines 
claros. Estos sonidos familiares son reconfortantes, los has oído antes. 
Cuando escuchas, tienes una vaga idea de lo que vendrá a continuación, y 
llega, aunque los sonidos sigan siendo remotos y confusos, como si 
estuvieses oyéndolos debajo del agua. 

El feto, dentro del vientre, rodeado de líquido amniótico, oye sonidos. 
Oye los latidos del corazón de su madre, acelerándose unas veces y otras 
aminorando. Y el feto oye música, como descubrió recientemente 
Alexandra Lamont, de la Universidad Keele del Reino Unido. Descubrió 
que los niños, un año después del nacimiento, reconocían y preferían 
música a la que habían estado expuestos en el claustro materno. El sistema 
auditivo del feto es plenamente funcional unas veinte semanas después de la 
concepción. En el experimento de Lamont las madres pusieron una pieza de 
música determinada a sus bebés repetidas veces durante los tres últimos 
meses de gestación. Por supuesto, los bebés estaban oyendo también 
(filtrados, a través del agua por el líquido amniótico) todos los sonidos de la 


vida cotidiana de sus madres, incluyendo la otra música, conversaciones y 
ruidos del entorno. Pero se eligió una pieza determinada para que cada bebé 
la oyese de forma regular. Las piezas seleccionadas se eligieron entre 
música clásica (Mozart, Vivaldi), los 40 Principales (Five, Backstreet 
Boys), reggae (UB40, Ken Boothe) y world beat (Spirits of Nature). 
Después del parto no se permitió a las madres poner la canción 
experimental a sus hijos. Un año después Lamont puso a los bebés la 
música que habían oído en el claustro materno, junto con otra pieza elegida 
por corresponderse en el estilo y el tempo con la otra. Por ejemplo, un bebé 
que había oído el tema de reggae «Many Rivers to Cross» de UB40, oyó de 
nuevo esa pieza, un año después, junto con «Stop Loving You» del artista 
de reggae Freddie McGregor. Lamont determinó entonces cuál de las dos 
preferían los niños. 

¿Cómo se puede saber cuál de los dos estímulos prefiere un niño 
preverbal? La mayoría de los que investigan con niños utilizan una técnica 
conocida como el procedimiento de giro de cabeza condicionado, ideado 
por Robert Fantz en la década de los sesenta y perfeccionado por John 
Columbo, Anne Fernald, el difunto Peter Jusczyk y sus colegas. Se instalan 
dos altavoces en el laboratorio y se coloca al niño entre ellos (normalmente 
en el regazo de su madre). Cuando un niño mira hacia un altavoz, éste 
empieza a emitir música o algún otro sonido, y cuando mira al otro altavoz, 
empieza a tocar música diferente o a emitir un sonido diferente. El niño 
aprende enseguida que puede controlar lo que se toque según mire a un lado 
o a otro; es decir, aprende que las condiciones del experimento están bajo su 
control. Los experimentadores se cercioran de que contrapesan (aleatorizan) 
la ubicación de la que llegan los diferentes estímulos; es decir, la mitad del 
tiempo el estímulo que se estudia llega de un altavoz y la otra mitad llega 
del otro. Cuando Lamont hizo esto con los niños de su estudio, descubrió 
que tendían a mirar más tiempo al altavoz que tocaba la música que ellos 
habían oído en el vientre materno que al de la música nueva, lo que 
confirmaba que preferían la música de la que habían tenido experiencia 
prenatal. Un grupo de control de niños de un año que no habían oído 
ninguna música de la utilizada antes no mostraron ninguna preferencia, 
confirmando que no había nada en la música en sí que causase aquellos 


resultados. Lamont descubrió también que, si no intervienen otros factores, 
el niño prefiere la música rápida y alegre a la lenta. 

Estos descubrimientos contradicen la idea predominante durante mucho 
tiempo de la amnesia infantil: que no podemos tener ningún recuerdo 
verídico antes de los cinco años, más o menos. Mucha gente asegura que 
tiene recuerdos de la temprana infancia, de en torno a los dos y tres años, 
pero es difícil saber si son verdaderos recuerdos del acontecimiento original 
o si son más bien recuerdos de lo que nos dijo alguien más tarde sobre el 
acontecimiento. El cerebro del niño de pecho está aún subdesarrollado, no 
se ha completado la especialización funcional y aún se hallan en proceso de 
construcción las vías neuronales. La mente del niño está intentando asimilar 
el máximo posible de información en el tiempo más breve posible; es 
característico que haya grandes vacíos en la interpretación, la conciencia y 
el recuerdo de los acontecimientos por parte del niño, debido a que aún no 
ha aprendido a diferenciar los acontecimientos importantes de los 
intrascendentes ni a codificar de forma sistemática la experiencia de la 
realidad. En consecuencia, es un candidato excelente para la sugestión, y 
podría archivar involuntariamente como propias historias que le contaron 
sobre él. Parece que en el caso de la música hasta la experiencia prenatal se 
archiva en la memoria, y se puede acceder a ella en ausencia de lenguaje o 
de conciencia explícita del recuerdo. 


Según un estudio que realizaron algunos periódicos y programas matutinos 
de entrevistas hace varios años, escuchar a Mozart durante diez minutos al 
día te hacía más listo («el Efecto Mozart»). Concretamente escuchar 
música, se aseguraba, puede mejorar el rendimiento en tareas de 
razonamiento espacial efectuadas inmediatamente después de la sesión de 
audición (en el caso de algunos periodistas se consideró afectada también la 
pericia matemática). Miembros del Congreso empezaron a aprobar 
resoluciones, el gobernador de Georgia asignó fondos para comprar un 
disco de Mozart a cada niño que naciese en el estado. La mayoría de los 
científicos se hallaban en una posición incómoda. Aunque creemos 
intuitivamente que la música puede estimular otras habilidades cognitivas, y 
aunque a todos nos gustaría ver que se dedican más fondos públicos a 


programas escolares de música, el estudio concreto que afirmaba esto 
contenía muchos fallos científicos. Afirmaba algunas cosas que eran ciertas, 
pero lo hacía por motivos que no lo eran. A mí personalmente todo este 
alboroto me pareció un poco ofensivo, porque parecía implicar que la 
música no debería estudiarse en sí, por derecho propio, sino sólo porque 
podía ayudar a la gente a hacer mejor otras cosas «más importantes». Piensa 
lo absurdo que esto podría resultar si le diésemos la vuelta. Si yo afirmase 
que estudiar matemáticas estimulaba la habilidad musical, ¿empezarían los 
políticos a bombear dinero para las matemáticas por ese motivo? La música 
ha sido a menudo la hijastra pobre de las escuelas públicas, lo primero que 
se elimina cuando hay problemas de financiación, y la gente suele intentar 
justificar el hecho de que se enseñe por sus beneficios colaterales, en vez de 
dejar que exista por sus frutos. 

El problema del estudio de «la música te hace más listo» es bastante 
evidente: los controles experimentales eran inadecuados, y la pequeña 
diferencia en la habilidad espacial entre los dos grupos, según la 
investigación de Bill Thompson, Glenn Schellenberg y otros, se debía sólo 
a la elección de la tarea de control. Comparado con estar sentado en una 
habitación sin hacer nada, escuchar música estaba muy bien. Pero si a los 
sujetos se les diese en esa tarea de control el más leve estímulo mental (oír 
un libro en grabación, leer, etc.) no habría ninguna ventaja para la audición 
de música. Otro problema del estudio era que no se proponía ningún 
mecanismo plausible por el que eso pudiese operar: ¿cómo podía el hecho 
de escuchar música aumentar la eficiencia espacial? 

Glenn Schellenberg ha destacado la importancia de diferenciar entre los 
efectos de la música a corto y a largo plazo. El Efecto Mozart se refería a 
efectos inmediatos, pero otra investigación ha revelado efectos a largo plazo 
de la actividad musical. Escuchar música estimula o modifica ciertos 
circuitos neuronales, incluyendo la densidad de conexiones dendríticas en el 
córtex auditivo primario. El neurocientífico de Harvard Gottfried Schlaug 
ha demostrado que la porción frontal del cuerpo calloso (la masa de fibras 
que conectan los dos hemisferios cerebrales) es significativamente mayor 
en los músicos que en los que no son músicos, y especialmente en los 
músicos que empiezan muy pronto su formación. Esto refuerza la idea de 


que las operaciones musicales pasan a ser bilaterales al aumentar la 
instrucción, pues los músicos coordinan y reclutan estructuras neuronales 
tanto en el hemisferio izquierdo como en el derecho. 

Varios estudios han descubierto cambios microestructurales en el 
cerebelo tras la adquisición de habilidades motrices, como las que 
adquieren los músicos, incluyendo un aumento del número y la densidad de 
las sinapsis. Schlaug descubrió que los músicos tendían a tener cerebelos 
más grandes que los que no lo eran, y una mayor concentración de materia 
gris; la materia gris es esa parte del cerebro que contiene los cuerpos 
celulares, axones y dentritas, y se la considera responsable del 
procesamiento de información, mientras que a la materia blanca se la 
considera responsable de transmitir información. 

No se ha demostrado que esos cambios estructurales del cerebro se 
traduzcan en un estímulo de las habilidades en campos ajenos a la música, 
pero se ha demostrado que la audición de música y la terapia musical 
ayudan a la gente a superar una amplia gama de problemas físicos y 
psicológicos. De todos modos, volviendo a una línea de investigación más 
fructífera respecto al gusto musical, los resultados de Lamont son 
importantes porque muestran que el cerebro prenatal y el del recién nacido 
son capaces de almacenar recuerdos y recuperarlos después de largos 
períodos de tiempo. Desde un punto de vista más práctico, los resultados 
indican que el entorno (incluso mediando el líquido amniótico y el claustro 
materno) puede afectar al desarrollo y a las preferencias del niño. Así que 
las semillas de la preferencia musical se siembran en el vientre materno, 
pero tiene que haber algo más que eso, porque si no los niños gravitarían 
simplemente hacia la música que les gusta a sus madres o que se pone en 
las clases de Lamaze. Lo que podemos decir es que lo que oímos en el 
vientre materno influye en las preferencias musicales pero no las determina. 
Hay también un largo período de aculturación, durante el cual el niño 
asimila la música de la cultura en la que nace. Hace unos años hubo 
informes según los cuales todos los niños, antes de acostumbrarse a la 
música de una cultura ajena (para nosotros) prefieren la música occidental a 
las otras músicas, independientemente de su cultura o de su raza. Estos 
informes no fueron corroborados, sino que lo que se descubrió fue que los 


niños muestran una preferencia mayor por la consonancia que por la 
disonancia. La percepción de la disonancia llega más tarde en la vida, y la 
gente difiere respecto al grado en que la puede soportar. 

Esto probablemente tenga una base neuronal. Los intervalos 
consonantes y los disonantes se procesan en el córtex auditivo a través de 
mecanismos diferenciados. Estudios recientes de las reacciones 
electrofisiológicas de humanos y monos a la disonancia sensorial (es decir, 
acordes que resultan disonantes en virtud de sus índices de frecuencia, no 
debido a un contexto armónico o musical) muestran que neuronas del córtex 
auditivo primario (el primer nivel de procesamiento cortical para el sonido) 
sincronizan sus índices de activación durante acordes disonantes, pero no 
durante los consonantes. Aún no está claro por qué eso tiene que crear una 
preferencia por la consonancia. 

Sabemos un poco sobre el mundo auditivo del niño de pecho. Aunque 
los oídos funcionan plenamente cuatro meses antes del nacimiento, el 
desarrollo del cerebro tardará meses o años en alcanzar la capacidad de 
procesamiento auditivo plena. Los niños pequeños reconocen trasposiciones 
de tono y de compás (cambios de tempo), lo que indica que son capaces de 
procesamiento relacional, algo que aún no son capaces de hacer demasiado 
bien los ordenadores más avanzados. Jenny Saffran, de la Universidad de 
Wisconsin, y Laurel Trainor, de la Universidad McMaster, han reunido 
pruebas de que los niños pequeños pueden también atender a entradas de 
oído absoluto si la tarea lo requiere, lo que parece indicar una flexibilidad 
cognitiva desconocida hasta ahora: los niños pequeños pueden utilizar 
diferentes modos de procesamiento (presumiblemente por medio de 
circuitos neuronales distintos) según lo que les ayude mejor a resolver el 
problema que se les plantea. 

Trehub, Dowling y otros han demostrado que el contorno es la 
característica musical más destacada para los niños pequeños; se pueden 
detectar similitudes de contorno y diferencias hasta con treinta segundos de 
retención. El recuerdo de ese contorno remite a una pauta de altura de tono 
musical de una melodía (la sucesión de subidas y bajadas que la melodía 
adopta) con independencia del tamaño del intervalo. Alguien que atienda 
exclusivamente al contorno sólo retendría que la melodía sube, por ejemplo, 


pero no cuánto. Hay un paralelismo entre la sensibilidad de los niños 
pequeños al contorno musical y su sensibilidad a contornos lingúísticos, que 
separan por ejemplo preguntas de exclamaciones y forman parte de lo que 
los lingiistas llaman prosodia. Fernald y Trehub han documentado las 
diferentes formas que tienen los padres de hablar a los niños pequeños, a los 
niños mayores y a los adultos, algo que se da en muchas culturas. La forma 
resultante de hablar a los bebés utiliza un tempo más lento, una gama tonal 
ampliada y un nivel de altura de tono global más alto. 

Las madres (y en una medida menor los padres) hacen esto con toda 
naturalidad sin ninguna instrucción explícita, utilizando una entonación 
exagerada que los investigadores llaman habla dirigida al niño o 
«maternés». Creemos que el maternés ayuda a llamar la atención de los 
bebés hacia la voz de su madre y ayuda a diferenciar palabras dentro de la 
frase. En vez de decir, como haríamos con un adulto: «Esto es una pelota», 
en maternés se diría algo así como: «¿Veeees?» (con el tono de la eeee 
subiendo hasta el final de la palabra). «¿Ves la PELOOOOTAAA?» (con el 
tono cubriendo un registro ampliado y subiendo de nuevo al final de la 
palabra «pelota»). En estas expresiones, el contorno es una señal de que la 
madre está haciendo una pregunta o una declaración, y al exagerar las 
diferencias entre los contornos de subida y bajada, la madre llama la 
atención hacia ellos. En realidad, la madre está creando un prototipo de 
pregunta y un prototipo de declaración, y asegurando que esos prototipos 
sean fácilmente diferenciables. Cuando una madre regaña con una 
exclamación, de un modo completamente natural (y de nuevo sin 
adiestramiento explícito), es probable que esté creando un tercer tipo de 
expresión prototípica, una expresión breve y cortada sin mucha variación de 
tono: «¡No!» (pausa) «¡No! ¡Mal!» (pausa) «¡He dicho que no!» Los bebés 
parecen venir con una capacidad incorporada de detectar y seguir el 
contorno, preferentemente, en intervalos de altura de tono específicos. 

Trehub demostró también que los niños pequeños tienen una capacidad 
mayor para codificar los intervalos consonantes como cuarta perfecta y 
quinta perfecta que los disonantes, como el tritono. Descubrió que los 
grados desiguales de nuestra escala hacen que resulte más fácil procesar 
intervalos incluso en la muy temprana infancia. Ella y sus colegas 


experimentaron con niños de nueve meses con la escala mayor regular de 
siete notas y dos escalas inventadas por ella. En una de esas escalas 
inventadas, dividió la octava en once grados de espacios iguales y luego 
seleccionó siete notas con pautas de uno y dos grados, y en la otra dividió la 
octava en siete grados iguales. La tarea de los niños era detectar una nota 
desentonada. A los adultos les fue bien con la escala mayor, pero mal con 
las dos escalas artificiales que nunca habían oído. Sin embargo, a los niños 
les fue igual de bien en las dos escalas de grados iguales y en la de 
desiguales. Por trabajos anteriores se cree que los niños de nueve meses aún 
no han incorporado un esquema mental para la escala mayor, así que esto 
parece indicar una ventaja general de procesamiento para grados desiguales, 
como los que tiene nuestra escala mayor. 

Dicho de otro modo, nuestros cerebros y las escalas musicales que 
utilizamos parecen haber coevolucionado. Y no es ningún accidente el que 
tengamos esa curiosa disposición asimétrica de notas en la escala mayor: es 
más fácil aprender melodías con esa ordenación, que es una consecuencia 
de la física de la producción del sonido (a través de las series de armónicos 
que anteriormente analizamos); el conjunto de tonos que utilizamos en 
nuestra escala mayor está muy próximo en altura a los que forman las series 
de armónicos. La mayoría de los niños empiezan en una etapa muy 
temprana de la infancia a vocalizar espontáneamente, y estas tempranas 
vocalizaciones pueden parecerse mucho al canto. Los bebés exploran el 
registro de sus voces y empiezan a explorar la emisión fonética, en 
respuesta a los sonidos que reciben del mundo que los rodea. Cuanta más 
música oyen, más probable es que incluyan variaciones rítmicas y de tono 
en sus vocalizaciones espontáneas. 

Los niños pequeños empiezan a mostrar una preferencia por la música 
de su cultura a los dos años de edad, aproximadamente en la época en que 
empiezan a desarrollar un procesamiento verbal especializado. Tienden a 
gustarles al principio canciones simples; música «simple» quiere decir 
temas claramente definidos (como algo opuesto, por ejemplo, a contrapunto 
a Cuatro partes) y progresiones de acordes que se resuelven de formas 
directas y fácilmente previsibles. Cuando maduran, los niños empiezan a 
cansarse de la música fácilmente predecible y a buscar música que plantee 


algún reto. Según Mike Posner, los lóbulos frontales y el cingulado anterior 
(una estructura situada justo detrás de los lóbulos frontales que dirige la 
atención) no están plenamente formados en los niños, lo que significa una 
incapacidad de prestar atención a varias cosas a la vez; a los niños les 
resulta difícil atender a un estímulo cuando hay presentes distracciones. 
Esto explica por qué a los niños menores de ocho años, más o menos, les 
resulta tan difícil cantar «rounds» como «Row, Row, Row Your Boat». Este 
sistema atencional, concretamente la red que conecta el giro cingulado (la 
estructura más grande en que se encuentra el cingulado anterior) y las 
regiones orbitofrontales del cerebro, no puede bloquear adecuadamente los 
estímulos no deseados o que distraen. Los niños que aún no han llegado a la 
etapa del desarrollo en que son capaces de excluir información auditiva 
irrelevante se enfrentan a un mundo de gran complejidad sónica con todos 
los sonidos irrumpiendo en un aluvión sensorial. Deben intentar seguir la 
parte de la canción que tiene que estar cantando su grupo, pero les distraen 
y les hacen tropezar las partes rivales de round. Posner ha demostrado que 
ciertos ejercicios adaptados de juegos de concentración y de atención 
utilizados por la NASA pueden ayudar a acelerar el desarrollo de la 
capacidad atencional del niño. 

La trayectoria que siguen los niños en su desarrollo de preferir primero 
canciones simples y luego más complejas es, por supuesto, una 
generalización; en primer lugar, no a todos los niños les gusta la música, y 
algunos desarrollan un gusto por la que se aparta del camino trillado, a 
veces por pura serendipia. Yo me quedé fascinado por la música de big 
band y swing cuando tenía ocho años, época en que mi abuelo me dio su 
colección de discos de 78 rpm de los años de la segunda guerra mundial. Lo 
que más me atrajo en principio fue lo novedoso de las canciones, como 
«The Syncopated Clock», «Would You Like to Swing on a Star», «The 
Teddy Bear's Picnic» y «Bibbidy Bobbidy Boo», canciones que estaban 
hechas para niños. Pero una exposición suficiente a las pautas de acordes y 
temples relativamente exóticos de las orquestas de Frank de Vol y Leroy 
Anderson se convirtieron en parte de mi cableado mental y no tardé en 
encontrarme escuchando todo tipo de jazz; el jazz de niños abrió las puertas 
neuronales para hacer el jazz en general saboreable y comprensible. 


Los investigadores señalan los diez años como el momento decisivo 
para las preferencias musicales. Es en torno a los diez u once años de edad 
cuando la mayoría de los niños se toman un interés real por la música, 
incluso los niños que no habían expresado antes interés por ella. La música 
hacia la que tendremos a sentir nostalgia en la edad adulta, la que sentimos 
como «nuestra» música, se corresponde con la que oímos durante esos años. 
Uno de los primeros indicios de la enfermedad de Alzheimer (una 
enfermedad caracterizada por cambios en los niveles de neurotransmisores 
y Células nerviosas, y por la destrucción de sinapsis) en los adultos de más 
edad es la pérdida de memoria. A medida que avanza la enfermedad, la 
pérdida de memoria se hace más profunda. Sin embargo, muchos de esos 
veteranos aún pueden recordar las canciones que oyeron cuando tenían 
catorce años y cantarlas. ¿Por qué catorce? Parte de la razón de que 
recordemos canciones de nuestros años de adolescencia es porque esos años 
fueron períodos de autodescubrimiento y estuvieron cargados en 
consecuencia emotivamente; tendemos en general a recordar cosas que 
tienen un componente emotivo, porque la amígdala y los neurotransmisores 
actúan de forma conjunta para «etiquetar» los recuerdos como algo 
importante. Parte de la razón tiene que ver también con la maduración 
neuronal y la poda; es hacia los catorce años cuando el cableado de nuestros 
cerebros musicales se aproxima a los niveles adultos de culminación. 

No parece haber un punto de ruptura a partir del cual no puedan 
adquirirse ya nuevos gustos en música, pero la mayoría de las personas 
tienen formados sus gustos entre los dieciocho y los veinte años. No está 
claro por qué sucede eso, pero varios estudios han descubierto que es así. 
Tal vez se deba en parte a que tendemos en general a abrirnos menos a 
nuevas experiencias al hacernos mayores. Durante los años de adolescencia 
empezamos a descubrir que existe un mundo de ideas diferentes, culturas 
diferentes, gentes diferentes. Experimentamos con la idea de que no 
tenemos que limitar el curso de nuestra vida, nuestra personalidad o 
nuestras decisiones a lo que nos enseñaron nuestros padres o a cómo se nos 
educó. Buscamos también tipos de música diferentes. En la cultura 
occidental en concreto, la elección de música tiene consecuencias sociales 
importantes. Escuchamos la música que escuchan nuestros amigos. Cuando 


somos jóvenes sobre todo y andamos a la busca de nuestra identidad, 
creamos vínculos o grupos sociales con gente a la que queremos parecernos 
o con la que creemos tener algo en común. Como un modo de exteriorizar 
el vínculo, vestimos de manera parecida, compartimos actividades y 
escuchamos la misma música. Nuestro grupo escucha este tipo de música, 
esa otra gente escucha otro. Esto enlaza con la idea evolucionista de la 
música como un vehículo de vinculación y cohesión social. La música y las 
preferencias musicales se convierten en una señal de distinción y de 
identidad personal y de grupo. 

Podríamos decir que las características de la personalidad de un 
individuo están asociadas, en cierta medida, con el tipo de música que le 
gusta, o que lo predicen. Pero viene determinada en mayor medida por 
factores que son más o menos casuales: dónde estudiaste, con quién salías, 
qué música daba la casualidad que escuchaban. Cuando yo viví de niño en 
el norte de California, lo mejor era Creedence Clearwater Revival...; eran 
de allí al lado. Cuando me trasladé al sur de California, el sello CCR de 
música country-hick no se ajustaba bien a la cultura surfista/Hollywood que 
incluye a los Beach Boys y a artistas de actuación más teatral como David 
Bowie. 

El cerebro está además desarrollando y formando nuevas conexiones a 
una velocidad explosiva a lo largo de la adolescencia, pero ese ritmo se 
reduce sustancialmente después de ese período, la fase formativa en que los 
circuitos neuronales quedan estructurados por nuestras experiencias. Ese 
proceso se aplica a la música que oímos; la nueva música pasa a 
incorporarse dentro de la estructura de la música que escuchamos en ese 
período crítico. Sabemos que hay períodos críticos para la adquisición de 
nuevas habilidades, como el lenguaje. Si el niño no aprende un idioma 
hacia los seis años (ya sea el primero o el segundo) nunca aprenderá a 
hablar con esa facilidad que caracteriza a la mayoría de los hablantes 
nativos de un idioma. Con la música y con las matemáticas el margen es 
más amplio, pero no ilimitado: si un estudiante no ha recibido lecciones de 
música ni estudiado matemáticas antes de los veinte años, aún puede 
aprender esas materias, pero sólo con gran dificultad, y es probable que 
nunca llegue a «hablar» en el lenguaje de las matemáticas ni en el de la 


música como alguien que las haya aprendido antes. Esto se debe a la 
trayectoria biológica del crecimiento sináptico. Las sinapsis del cerebro 
están programadas para crecer durante un número de años, haciendo nuevas 
conexiones. Después de ese período, hay un cambio hacia la poda, para 
librarse de conexiones innecesarias. 

La neuroplasticidad es la capacidad del cerebro para reorganizarse. 
Aunque en los últimos cinco años ha habido algunas demostraciones 
impresionantes de reorganización cerebral que no se consideraban posibles, 
el grado de reorganización que puede producirse en la mayoría de los 
adultos es muchísimo menor de la que puede producirse en los niños y en 
los adolescentes. 

Hay diferencias individuales, claro. Lo mismo que hay personas que se 
curan de cortes en la piel y huesos rotos antes que otras, las hay también 
que pueden establecer nuevas conexiones con más facilidad que otras. La 
poda se inicia generalmente entre los ocho y los catorce años de edad en los 
lóbulos frontales, la sede del pensamiento superior y el razonamiento, la 
planificación y el control del impulso. Empieza a aumentar durante ese 
período la mielinación. La mielina es una substancia grasa que cubre los 
axones, acelerando la transmisión sináptica. (Ésa es la razón de que 
aumente en los niños al hacerse mayores la capacidad y la rapidez para 
resolver problemas más complejos.) La mielinación de todo el cerebro se 
completa en general a los veinte años de edad. La esclerosis múltiple es una 
de las diversas enfermedades degenerativas que pueden afectar a la vaina de 
mielina que rodea las neuronas. 

El equilibrio entre simplicidad y complejidad en la música influye 
también en nuestras preferencias. Estudios científicos sobre lo que nos 
gusta y lo que no nos gusta en una diversidad de dominios estéticos 
(pintura, poesía, danza y música) han demostrado que existe una relación 
metódica entre la complejidad de una obra artística y lo que nos gusta. Por 
supuesto, la complejidad es un concepto totalmente subjetivo. Para que la 
idea tenga algún sentido, tenemos que aceptar que lo que le parece de una 
complejidad impenetrable a un individuo podría corresponder al «punto 
dulce» de preferencia de otro. Asimismo, lo que a una persona le parece 
soso y de una simplicidad odiosa, a otra podría parecerle difícil de entender, 


debido a diferencias de formación, experiencia, interpretación y esquemas 
cognitivos. 

Los esquemas lo son todo en cierto modo. Estructuran nuestra 
comprensión; son el sistema en el que emplazamos los elementos y las 
interpretaciones de un objeto estético. Los esquemas alimentan nuestras 
expectativas y nuestros modelos cognitivos. Con un esquema, la Quinta de 
Mahler es perfectamente interpretable, incluso aunque se oiga por primera 
vez: es una sinfonía, sigue la forma sinfónica con cuatro movimientos; 
contiene un tema principal y subtemas, y repeticiones del tema; los temas se 
manifiestan a través de instrumentos orquestales, a diferencia de los 
tambores hablantes africanos o del distorsionador (fuzz bass). Los que 
conozcan la Cuarta de Mahler se darán cuenta de que la Quinta se inicia con 
una variación del mismo tema, e incluso el mismo tono. Los que conozcan a 
fondo la obra de Mahler se darán cuenta de que el compositor incluye citas 
de tres de sus propias canciones. Los que tengan formación musical se 
darán cuenta de que la mayoría de las sinfonías desde Haydn a Brahms y 
Bruckner empiezan y acaban característicamente con la misma nota. Mahler 
prescinde de esa convención en su Quinta, pasando de do menor sostenido a 
la menor y finalmente acaba en re mayor. Si no hubieses aprendido a 
mantener en tu mente un sentido de tonalidad mientras se desarrolla la 
sinfonía, o si no tuvieses un sentido de la trayectoria normal de una 
sinfonía, esto carecería de sentido; pero para el oyente experimentado, ese 
desacato a la convención aporta una sorpresa grata, una violación de 
expectativas, especialmente cuando esos cambios de tonalidad se hacen con 
la habilidad precisa para que no resulten estridentes. La Quinta de Mahler, 
al carecer de un esquema sinfónico apropiado, o si el oyente posee otro 
esquema, por ejemplo el de un aficionado a la música de rasgas india, es 
absurda o tal vez divagatoria, una idea musical se funde en ella con la 
siguiente de un modo amorfo, sin ninguna frontera, sin principios ni fines 
que la hagan parecer parte de un todo coherente. El esquema enmarca 
nuestra percepción, nuestro procesamiento cognitivo y en último término 
nuestra experiencia de la realidad. 

Cuando una pieza musical es demasiado simple tiende a no gustarnos, 
nos parece trivial. Cuando es demasiado compleja, tiende también a no 


gustarnos, nos parece imprevisible: no percibimos que esté asentada en algo 
familiar. La música, como toda forma artística en realidad, tiene que lograr 
para que nos guste el equilibrio justo entre sencillez y complejidad. La 
sencillez y la complejidad se relacionan con la familiaridad y familiaridad 
es una palabra que equivale a esquema. 

En ciencia es importante, por supuesto, definir los términos. ¿Qué 
significa «demasiado simple» o «demasiado complejo»? Una definición 
operativa es que una pieza nos parece demasiado simple cuando es tan 
previsible que resulta trivial, parecida a algo que hemos oído antes y que no 
nos plantea el menor reto. Pensemos, por analogía, en el juego de tres en 
raya. A los niños les resulta infinitamente fascinante porque tiene muchas 
características que resultan interesantes para su nivel de capacidad 
cognitiva: tiene normas claramente definidas que cualquier niño puede 
exponer con facilidad; tiene un elemento de sorpresa porque el jugador 
nunca sabe seguro qué va a hacer exactamente su adversario; el juego es 
dinámico, porque en la jugada siguiente que uno hace influye la que haya 
hecho antes nuestro adversario; cuándo acabará el juego, quién ganará o si 
habrá un empate es algo indeterminado, pero hay un límite externo de 
nueve jugadas. Esa indeterminación crea tensión y expectativas, y la tensión 
se libera finalmente cuando termina la partida. 

Al mismo tiempo que desarrolla un refinamiento cognitivo creciente, el 
niño va aprendiendo estrategias: el que juega segundo no puede ganar frente 
a un jugador competente; a lo máximo que puede aspirar es a empatar. 
Cuando la secuencia de jugadas y el final de la partida resultan previsibles, 
el tres en raya pierde su atractivo. Por supuesto, los adultos aún podemos 
disfrutar jugando al tres en raya con niños, pero disfrutamos viendo el 
placer en la cara del niño y disfrutamos del proceso (que se extiende a lo 
largo de varios años) durante el cual el niño aprende a desentrañar los 
misterios del juego al ir desarrollándose su cerebro. 

Para muchos adultos Raffi y Barney el Dinosaurio son el equivalente 
musical del tres en raya. Cuando la música es demasiado previsible, el 
desenlace demasiado seguro y el «movimiento» de una nota o de un acorde 
al siguiente no contiene ningún elemento de sorpresa, la música nos parece 
insulsa y simplista. Mientras la música está sonando (sobre todo si tienes la 


atención centrada en ella), el cerebro va pensando por delante cuáles son las 
diferentes posibilidades para la nota siguiente, hacia dónde va la música, su 
trayectoria, la dirección que se propone seguir y su punto final definitivo. El 
compositor tiene que conseguir emplazarnos en un estado de confianza y de 
seguridad; tenemos que dejarle que nos lleve en un viaje armónico; tiene 
que darnos las suficientes pequeñas recompensas (culminaciones de 
expectativas) para que tengamos una sensación de orden y una sensación de 
ubicación. 

Pongamos que estás haciendo autostop de Davis, California, a San 
Francisco. Podrías querer que la persona que te coja te lleve por la ruta 
normal, la autopista 80. Podrías estar dispuesto a tolerar unos cuantos 
atajos, sobre todo si el automovilista es cordial, creíble y te dice claramente 
lo que está haciendo. («Voy a cortar por aquí para evitar las obras que hay 
en la autopista».) Pero si te lleva por carreteras secundarias sin darte 
ninguna explicación y llega un momento en que no ves ya señales ni hitos, 
seguro que tu sentido de la seguridad se siente acosado. Por supuesto, las 
reacciones a esos viajes no previstos, musicales o automovilísticos, serán 
diferentes según las diferentes personas y los diferentes tipos de 
personalidad. Algunos reaccionarán con puro pánico («¡Ese Stravinsky está 
volviéndome loco!») y otros con espíritu aventurero ante la emoción del 
descubrimiento («Coltrane está haciendo aquí una cosa rara, pero, qué 
demonios, no me hará ningún mal seguir oyendo un poco, soy 
perfectamente capaz de preservar mi yo armónico y de encontrar el camino 
de vuelta a la realidad musical si tengo que hacerlo»). 

Continuando la analogía con los juegos, hay algunos con reglas tan 
complicadas que el individuo medio no tiene paciencia para aprenderlas. 
Las opciones de lo que puede pasar en cualquier momento son demasiado 
numerosas e imprevisibles para que el novicio pueda considerarlas. Pero la 
incapacidad para prever qué pasará a continuación no siempre es una señal 
de que un juego acabe teniendo interés si uno persiste en él el tiempo 
suficiente. Un juego puede tener una trayectoria completamente imprevista 
sin que importe el que tengas mucha práctica en él: hay muchos juegos de 
mesa en que todo consiste en tirar el dado y esperar a ver qué es lo que sale. 
Es lo que pasa por ejemplo con la Oca. Los niños disfrutan de la sensación 


de sorpresa, pero a los adultos el juego puede resultarles tedioso porque, 
aunque nadie pueda prever exactamente lo que pasará (todo depende del 
azar de las tiradas de dados), el resultado no tiene ninguna estructura y no 
puede influir además en el proceso la habilidad del jugador. 

La música que contiene demasiados cambios de acordes, o una 
estructura con la que los oyentes no están familiarizados, puede conducir a 
muchos de ellos directamente a la salida más próxima, o al botón de «salto» 
de su equipo de música. Algunos juegos, como Go, Axiom o Zendo, 
resultan lo bastante complicados y opacos al novicio para que muchos 
renuncien antes de llegar muy lejos: la estructura ofrece una curva de 
aprendizaje empinada, y el novicio no puede estar seguro de si el tiempo 
que ha de invertir merecerá la pena o no. Muchos tenemos la misma 
experiencia con música o con formas musicales con las que no estamos 
familiarizados. La gente puede explicarte que Schónberg es brillante, o que 
Tricky es el próximo Prince, pero si no puedes hacerte idea de lo que está 
pasando en el primer minuto o así de una de sus piezas, quizás empieces a 
preguntarte si los beneficios justificarán el esfuerzo que dedicas a intentar 
aclararlo todo. Nos decimos que si lo escuchamos el número suficiente de 
veces, podremos empezar a entenderlo y nos gustará tanto como les gusta a 
nuestros amigos. Sin embargo, recordamos otras ocasiones de nuestras 
vidas en las que invertimos horas escuchando a un artista y nunca llegamos 
a ese punto en el que lo «cogemos». Intentar apreciar nueva música puede 
ser como considerar una nueva amistad teniendo en cuenta que lleva tiempo 
y que a veces no hay nada que puedas hacer para acelerar el asunto. A nivel 
neuronal, tenemos que poder encontrar unos cuantos hitos que nos permitan 
invocar un esquema cognitivo. Si oímos una pieza de música radicalmente 
nueva el suficiente número de veces, parte de esa pieza acabará codificada 
en el cerebro y formaremos hitos. Si el compositor es habilidoso, esas 
partes de la pieza que se convierten en nuestros hitos serán las mismas que 
el compositor se propuso que fuesen; su conocimiento de la composición y 
de la memoria y la percepción humanas le habrá permitido crear ciertos 
«ganchos» en la música que acabarán instalándose en nuestra mente. 

El procesamiento estructural plantea dificultades al apreciar una nueva 
pieza musical. No entender la forma sinfónica, o la forma de sonata, o la 


estructura AABA de una pauta de jazz es el equivalente en escuchar música 
a conducir por una autopista sin señales de tráfico: nunca sabes dónde estás 
ni cuándo llegarás a tu destino (o incluso a un punto intermedio que no sea 
tu destino, pero que pueda proporcionar un hito orientador). Por ejemplo, 
mucha gente simplemente no «entiende» el jazz; dice que suena como una 
improvisación loca sin forma ni estructura, una competición musical que 
consiste en ver quién mete el mayor número de notas posible en el menor 
espacio posible. Hay más de media docena de subgéneros de lo que la gente 
llama colectivamente «jazz»: dixieland, bugi-bugi, big band, swing, bebop, 
«sin etiqueta», acid-jazz, fusión, metafísico, etc. El jazz «sin etiqueta» O 
«clásico», como también se le llama a veces, es más o menos la forma 
estándar de jazz, análoga a la sonata o la sinfonía en la música clásica, o a 
lo que es para la música rock una canción típica de los Beatles o de Billy 
Joel o de Temptations. 

En el jazz clásico el artista empieza tocando el tema principal de la 
canción; se trata a menudo de una canción bien conocida de Broadway, O 
una que ha sido ya un éxito con algún otro artista; esas canciones se llaman 
«clásicos», y se incluyen entre ellas «As Time Goes By», «My Funny 
Valentine» y «All of Me». El artista recorre la forma completa de la canción 
una vez; lo característico son dos versos y el coro (conocido también como 
un «estribillo»), seguido de otro verso. El coro es la parte de una canción 
que se repite regularmente a lo largo de ella; los versos son lo que cambia. 
Llamamos a esta forma AABA, donde la letra A representa el verso y la 
letra B representa el coro. AABA significa que tocamos verso-verso-coro- 
verso. Hay muchas otras variaciones posibles, por supuesto. Algunas 
canciones tienen una sección C, llamada el puente. 

El término coro se utiliza para indicar no sólo la segunda sección de la 
canción, sino también un recorrido de la forma completa. En otras palabras, 
recorrer la porción AABA de una canción una vez se llama «tocar un coro». 
Cuando yo toco jazz, si alguien dice: «Toca el coro» o «Hagamos el coro» 
(utilizando el artículo el), damos por supuesto que significa una sección de 
la canción. Si en vez de eso alguien dice «Hagamos un coro» o «Hagamos 
un par de coros», sabemos que quiere decir la forma entera. 


«Blue Moon» (Frank Sinatra, Billie Holiday) es un ejemplo de canción 
con la forma AABA. Un artista de jazz puede jugar con el ritmo o la forma 
de sentir la canción y puede embellecer la melodía. Después de recorrer la 
forma de la canción una vez, que es a lo que los músicos de jazz llaman «la 
cabeza», los diferentes miembros del conjunto se turnan improvisando 
música nueva sobre la forma y la progresión de acordes de la canción 
original. Cada músico toca uno o más acordes y luego el músico siguiente 
retoma del principio de la cabeza. Durante las improvisaciones, algunos 
artistas se atienen rigurosamente a la melodía original, otros añaden 
desviaciones armónicas cada vez más alejadas y exóticas. Cuando todos han 
tenido una oportunidad de improvisar, la banda vuelve a la cabeza, 
tocándola más o menos tal cual es y con eso se acaba. Las improvisaciones 
pueden durar muchos minutos, no es raro que una versión de jazz de una 
canción de dos o tres minutos se prolongue hasta diez o quince. Hay 
también un orden característico de cómo se turnan los músicos: primero los 
instrumentos metálicos de viento, seguidos del piano y/o la guitarra, 
después el bajo. A veces improvisa también el batería, y lo característico es 
que lo haga después del bajo. A veces los músicos comparten parte de un 
coro, tocando cada uno de ellos de cuatro a ocho compases y pasando luego 
el solo a otro músico, una especie de carrera de relevos musical. 

Al novato todo este asunto puede parecerle caótico, pero el sólo hecho 
de saber que se produce la improvisación sobre los coros y la forma original 
de la canción puede significar mucho para orientar al neófito e indicarle en 
qué parte de la canción están los intérpretes. Yo suelo aconsejar a los que 
empiezan a escuchar jazz que se limiten a tararear mentalmente la melodía 
principal en cuanto empiece la improvisación (eso es lo que suelen estar 
haciendo los propios improvisadores) porque es algo que enriquece 
considerablemente la experiencia. 

Cada género musical tiene su propia serie de reglas y su propia forma. 
Cuanto más escuchamos, más se instalan esas normas en la memoria. No 
estar familiarizado con la estructura puede conducir a frustración o a una 
simple falta de aprecio. Conocer un género o un estilo es tener en realidad 
una categoría edificada a su alrededor y ser capaz de categorizar nuevas 
canciones como miembros o no de esa categoría... y en algunos casos como 


miembros «parciales» o «imprecisos» de ella, miembros sometidos a ciertas 
excepciones. 


La relación ordenada entre complejidad y gusto se denomina la función U 
invertida, por la forma que tendría un gráfico que relacionase esos dos 
factores. Imagina un gráfico en el que el eje X es lo compleja que es (para 
ti) una pieza de música, y el eje Y lo que te gusta. En la parte inferior 
izquierda de este gráfico, cerca del origen, habría un punto para la música 
que es muy simple, y tu reacción es que no te gusta. Al aumentar la 
complejidad de la música, aumenta también el placer que te causa. Las dos 
variables se van siguiendo entre ellas un rato en el gráfico: un aumento de 
la complejidad produce un aumento en el aprecio, hasta que cruzas cierto 
umbral personal y pasas, del desagrado intenso frente a la pieza, a que 
empiece a gustarte un poco. Pero llega un momento en que al seguir 
aumentando la dificultad, la música se hace demasiado compleja y empieza 
a gustarte menos. El gusto va disminuyendo a partir de entonces, hasta que 
cruzas otro umbral y esa música ya no te gusta en absoluto. Es demasiado 
difícil y no te gusta nada. La forma de ese gráfico sería una U o una V 
invertida. 

La hipótesis de la U invertida no significa que la única razón por la que 
pueda gustarte o no una pieza de música sea su sencillez o su complejidad. 
Lo que se pretende es más bien explicar esa variable. Los propios elementos 
de la música pueden formar una barrera que impida apreciar una pieza 
nueva. Si la música es demasiado fuerte o demasiado suave, eso puede 
resultar, claro está, problemático. Pero hasta el registro dinámico de una 
pieza (la disparidad entre las partes de sonido más fuerte y las más suaves) 
puede hacer que algunas personas la rechacen. Esto puede suceder sobre 
todo con los que utilizan la música para regular su estado de ánimo de una 
forma específica. Alguien que quiera oír música para relajarse o para 
estimularse con vistas a una tanda de ejercicios gimnásticos, es probable 
que no quiera escuchar una pieza musical que recorra toda la gama de 
intensidad desde lo muy suave a lo muy fuerte, o emotivamente desde lo 
triste a lo excitante (como hace, por ejemplo, la Quinta de Mahler). Tanto el 


registro dinámico como el emocional resultan sencillamente demasiado 
amplios y pueden crear una barrera que bloquee el acceso. 

El tono puede influir también en la preferencia. Algunas personas no 
pueden soportar los tiempos graves y golpeteantes del moderno hip-hop, 
otros no soportan lo que describen como el quejido agudo de los violines. 
Esto puede ser en parte cuestión de fisiología; algunos oídos pueden 
literalmente transmitir partes distintas del espectro de frecuencias que otros, 
y como resultado algunos sonidos parecen agradables y otros odiosos. 
Puede haber también asociaciones psicológicas, tanto positivas como 
negativas, con los diversos instrumentos. 

El ritmo y las pautas rítmicas influyen en nuestra capacidad para 
apreciar una composición o un género musical determinado. A muchos 
músicos les atrae la música latina por la complejidad de los ritmos. Para un 
novicio, todo suena simplemente «latino», pero para alguien que puede 
diferenciar los matices, cuándo un determinado compás es fuerte respecto a 
otros, la música latina es un mundo de interesante complejidad: bossa nova, 
samba, rumba, beguine, mambo, merengue, tango..., cada uno de ellos es 
un estilo de música completamente diferenciado e identificable. Hay 
muchas personas a las que les gusta realmente la música y los ritmos 
latinos, sin que sean capaces de diferenciarlos, por supuesto, pero para otros 
esos ritmos resultan demasiado complicados e imprevisibles, y eso los aleja 
de ellos. He descubierto que si enseño uno o dos ritmos latinos a los 
oyentes, acaban apreciándolos; es todo cuestión de tener una base y un 
esquema. Para otros los ritmos que son demasiado simples les hacen 
rechazar un estilo de música. La queja típica de la generación de mis padres 
respecto al rock, aparte de que el sonido les parecía muy fuerte, era que 
todo tenía el mismo compás. 

El timbre es otra barrera para muchas personas y su influencia está casi 
con seguridad creciendo, tal como expliqué en el capítulo 1. La primera vez 
que oí cantar a John Lennon y a Donald Fagen las voces me parecieron 
inconcebiblemente extrañas. No quería que me gustasen. Pero había algo 
que me hacía volver a escucharlas (tal vez el que fuesen tan extrañas) y 
acabarían siendo dos de mis voces favoritas; voces que ahora han pasado el 
límite de lo familiar y se aproximan a lo que sólo puedo llamar íntimo; 


siento como si esas voces hubiesen llegado a incorporarse a lo que soy. Y a 
un nivel neuronal, lo han hecho. Después de oír miles de horas a estos dos 
cantantes y de poner decenas de miles de veces sus canciones, mi cerebro 
ha desarrollado un sistema de circuitos que puede distinguir sus voces entre 
miles, aunque canten algo que no les haya oído cantar nunca. Mi cerebro ha 
codificado todos los matices vocales y todos los floreros tímbricos, de 
manera que si oigo una versión alternativa de una de sus canciones (como 
en las versiones de demostración de la John Lennon Collection de sus 
álbumes), puedo identificar de inmediato en qué se desvía una 
interpretación de la que tengo almacenada en las vías neuronales de la 
memoria a largo plazo. 


Nuestras preferencias musicales, como sucede con otros tipos de 
preferencias, están influidas también por lo que hemos experimentado 
antes, y por si el resultado de esa experiencia fue positivo o negativo. Si 
tuviste una experiencia negativa una vez con la calabaza (digamos, por 
ejemplo, que te sentó mal), es probable que mires con recelo futuras 
incursiones de degustación. Si has tenido sólo unas cuantas experiencias, 
pero predominantemente positivas, con el brócoli, podrías estar dispuesto a 
probar una nueva receta de brócoli, tal vez sopa de brócoli, aunque no la 
hayas comido nunca. La única experiencia positiva genera otras. 

Los tipos de sonidos, ritmos y texturas musicales que nos resultan 
agradables son en general ampliaciones de experiencias positivas previas 
que hemos tenido con la música a lo largo de la vida. Esto es porque oír una 
canción que te gusta es muy parecido a disfrutar de cualquier otra 
experiencia sensorial agradable: comer una chocolatina, frambuesas recién 
cogidas, el olor a café por la mañana, ver una obra de arte o el plácido 
rostro de alguien a quien quieres que está durmiendo. La experiencia 
sensorial nos causa placer y su familiaridad y la seguridad que esa 
familiaridad aporta nos resultan gratas. Puedo mirar una frambuesa madura, 
olerla y prever que sabrá bien y que la experiencia será segura: no me 
sentará mal. Si no he visto nunca una frambuesa de Logan, hay suficientes 
puntos en común con la frambuesa normal para que corra el riesgo de 
comerla y prevea que no habrá problema. 


La seguridad juega en muchos casos un papel en la elección de música. 
Nos entregamos en cierta medida a la música cuando la escuchamos: y nos 
permitimos confiar a los compositores y a los músicos una parte de nuestros 
corazones y de nuestro espíritu; dejamos que la música nos lleve a algún 
lugar situado fuera de nosotros mismos. Muchos sentimos que la buena 
música nos conecta con algo mayor que nuestra propia existencia, o con 
otras personas o con Dios. Incluso cuando la buena música no nos 
transporta a un lugar emocional que es trascendente, puede cambiar nuestro 
estado de ánimo. Es comprensible, pues, que podamos mostrarnos reacios a 
bajar la guardia, a prescindir de nuestras defensas emotivas, con cualquiera. 
Lo haremos si los músicos y el compositor nos hacen sentirnos seguros. 
Queremos saber que no se va a explotar nuestra vulnerabilidad. Ésa es en 
parte la razón de que algunas personas no sean capaces de escuchar a 
Wagner. Hay quien no se siente seguro escuchando su música debido a su 
pernicioso antisemitismo, a la profunda vulgaridad de su mente (en palabras 
de Oliver Sacks) y a la asociación de su música con el régimen nazi. A mí 
Wagner me ha perturbado siempre profundamente, y no sólo su música, 
sino también la idea de escucharla. Me siento reacio a entregarme a la 
seducción de una música creada por una mente tan perturbada y un corazón 
tan peligroso (e impenetrablemente duro) como el suyo, por miedo a poder 
desarrollar algunos de esos mismos horribles pensamientos. Cuando oigo la 
música de un gran compositor siento que estoy, en cierto modo, haciéndome 
uno con él, o dejando que una parte de él entre en mí. Esto también resulta 
inquietante con la música popular, ya que no hay duda de que algunos de 
los proveedores de pop son toscos, sexistas, racistas O las tres cosas a la vez. 

Esta sensación de vulnerabilidad y entrega predomina muy 
especialmente en el rock y en la música popular de los últimos cuarenta 
años. Es lo que explica las multitudes de seguidores que rodean a los 
músicos populares (los Grateful Dead, la Dave Matthews Band, Phish, Neil 
Young, Joni Mitchell, los Beatles. R.E.M., Ani DiFranco). Les permitimos 
controlar nuestras emociones e incluso nuestras ideas políticas, que nos 
animen, que nos depriman, que nos conforten, que nos inspiren. Les 
dejamos entrar en nuestros salones y nuestros dormitorios cuando estamos 
solos. Les dejamos entrar en nuestros oídos, directamente, a través de 


auriculares, cuando no estamos comunicándonos con nadie más en el 
mundo. 

Es insólito que nos entreguemos a un absoluto desconocido de ese 
modo, en una posición tan vulnerable. La mayoría de nosotros tenemos 
algún tipo de protección que nos impide soltar cada pensamiento y cada 
sentimiento que nos asalta. Cuando alguien nos pregunta: «¿Qué tal te va?», 
decimos: «Bien», aunque estemos tristes por una pelea que acabamos de 
tener en casa, O tengamos una pequeña molestia física. Mi abuelo solía 
decir que la definición de un pelma es alguien que cuando le preguntas: 
«¿Cómo estás?» te lo explica de verdad. Hay algunas cosas que 
simplemente mantenemos ocultas, incluso con los amigos íntimos (por 
ejemplo problemas relacionados con la digestión o con los intestinos, o 
sentimientos de inseguridad personal). Una de las razones de que estemos 
dispuestos a adoptar esa posición tan vulnerable con nuestros músicos 
favoritos es que se nos presentan ellos también a menudo como vulnerables, 
o transmiten vulnerabilidad a través de su arte (y no importa a esos efectos 
si son realmente vulnerables o se limitan a representarlo artísticamente). 

El poder del arte consiste en que puede conectarnos entre nosotros, y 
con verdades más amplias sobre lo que significa estar vivo y lo que 
significa ser humano. Cuando Neil Young canta 


Viejo, mira mi vida, soy muy parecido a como eras tú... 
Vivo solo en un paraíso que me hace pensar en dos. 


lo sentimos por el hombre que escribió la canción. Yo puedo no vivir en un 
paraíso, pero puedo sentirme solidario con un hombre que puede tener 
cierto éxito material pero nadie con quien compartirlo, un hombre que 
siente que ha «ganado el mundo pero perdido su alma», como cantó una vez 
George Harrison, citando al mismo tiempo el Evangelio según san Marcos y 
a Mahatma Gandhi. 

O cuando Bruce Springsteen canta «Back in Your Arms» sobre el amor 
perdido, vibramos ante un tema similar, por un poeta con un personaje que 
puede ser «cualquiera» como el de Neil Young. Y cuando consideramos lo 
mucho que tiene Springsteen (la adoración de millones de personas en todo 


el mundo, y millones de dólares), resulta aún más trágico que no pueda 
tener a la única mujer a la que quiere. 

Percibimos vulnerabilidad en lugares insólitos y eso nos acerca más al 
artista. David Byrne (de Talking Heads) es conocido en general por sus 
letras abstractas y artísticas, con un toque cerebral. En su interpretación en 
solitario de «Lilies of the Valley» canta sobre estar solo y asustado. Parte de 
nuestro aprecio por su letra lo estimula el hecho de saber algo sobre el 
artista, O al menos sobre el personaje del artista, que es un intelectual 
excéntrico, que era difícil que confesase algo tan primario y transparente 
como tener miedo. 

Las conexiones con el artista o con lo que el artista representa pueden, 
pues, formar parte de nuestras preferencias musicales. Johnny Cash cultivó 
una imagen forajida y mostró también su compasión por los presidiarios 
haciendo muchos conciertos en las cárceles. A los presos puede gustarles la 
música de Johnny Cash (o llegar a gustarles) por lo que el artista representa, 
independientemente de consideraciones estrictamente musicales. Pero los 
fans sólo llegarán hasta ahí siguiendo a sus héroes, como aprendió Dylan en 
el Festival Folk de Newport. Johnny Cash podría cantar sobre querer dejar 
la cárcel sin ahuyentar a su público, pero si hubiese dicho que le gustaba 
visitar las cárceles porque eso le ayudaba a apreciar más su propia libertad, 
habría cruzado sin duda una línea que separa la compasión del regodeo, y 
de forma comprensible, su público presidiario se habría enfurecido con él. 

Las preferencias comienzan con la exposición y cada uno de nosotros 
tiene su propio cociente de «aventurerismo» sobre cuánto estamos 
dispuestos a alejarnos en un momento dado de nuestra zona de seguridad 
musical. Algunos somos más aficionados a experimentar que otros en todos 
los aspectos de la vida, incluida la música, y podemos hacerlo o evitarlo en 
diversos períodos de nuestra vida. En general, es en los períodos en los que 
nos sentimos aburridos cuando buscamos nuevas experiencias. Ahora que 
los intérpretes en solitario de música y de radio por Internet se están 
haciendo más populares, creo que veremos emisoras de música 
personalizadas en pocos años, en las que todo el mundo pueda tener su 
emisora de radio personal, controlada por algoritmos informáticos que nos 
proporcione una mezcla de música que ya conocemos y que nos gusta, y 


una mezcla de música que no conocemos pero que es probable que nos 
guste. Creo que será importante que cualquiera que sea la forma que adopte 
esta tecnología, los oyentes puedan tener un mando de «aventurerismo» que 
puedan apagar y que controle la mezcla de lo viejo y lo nuevo, o lo lejos 
que esté la nueva música de lo que normalmente escucha. Se trata de algo 
que varía muchísimo de una persona a otra, e incluso, en la misma persona, 
de un período del día al siguiente. 

La música que oímos crea esquemas para géneros y formas musicales 
hasta cuando sólo oímos de un modo pasivo y no intentamos analizar la 
música. Sabemos desde una edad temprana cuáles son las medidas 
aceptadas por la música de nuestra cultura. Para muchos, lo que nos guste y 
lo que no nos guste en el futuro será consecuencia de los tipos de esquemas 
cognitivos formados con la música que oímos durante la infancia. No 
quiero decir con esto que la música que escuchamos de niños vaya a 
determinar necesariamente nuestros gustos musicales durante el resto de la 
vida; muchas personas están expuestas a música de estilos y culturas 
diferentes, o los estudian, y se aculturan a ellos, aprendiendo también sus 
esquemas. La cuestión es que esa temprana exposición suele ser la más 
profunda, y se convierte en el fundamento de nuestra futura visión de la 
música. 

Las preferencias musicales tienen también un gran componente social 
basado en lo que sabemos del cantante o el músico, en lo que sabemos que 
le gusta a la familia y a los amigos y en lo que sabemos sobre lo que la 
música representa. Desde el punto de vista histórico, y especialmente desde 
el evolutivo, la música ha formado parte de las actividades sociales. Esto 
puede explicar por qué la forma más común de expresión musical, desde los 
Salmos de David a Tin Pan Alley y a la música contemporánea, sea la 
canción de amor, y por qué para la mayoría de nosotros las canciones de 
amor parecen figurar entre nuestras cosas favoritas. 
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EL INSTINTO DE LA MÚSICA 


EL ÉXITO NÚMERO 1 DE LA EVOLUCIÓN 


¿De dónde vino la música? El estudio de los orígenes evolutivos de la 
música tiene una historia distinguida que se remonta al propio Darwin, que 
creía que se había desarrollado a través de la selección natural como parte 
de rituales de apareamiento humanos o paleohumanos. Yo creo que las 
pruebas científicas apoyan también esa idea, pero no todo el mundo está de 
acuerdo. Después de décadas de trabajos dispersos sobre el tema, el interés 
se centró súbitamente en 1997 en el reto que planteó el psicólogo cognitivo 
y científico cognitivo Steven Pinker. 

Hay unas doscientas cincuenta personas en todo el mundo que estudian 
cognición y percepción de la música como su foco primordial de 
investigación. Como sucede con la mayoría de las disciplinas científicas, 
celebramos conferencias una vez al año. En 1997 la conferencia se celebró 
en el MIT, y se invitó a Steven Pinker a pronunciar el discurso de apertura. 
Pinker acababa de terminar Cómo funciona la mente, un importante trabajo 
a gran escala que explica y sintetiza los principios importantes de la ciencia 
cognitiva, pero aún no había alcanzado notoriedad popular. «El lenguaje es 
claramente una adaptación evolutiva —nos dijo durante su discurso central 
—. De los mecanismos cognitivos que estudiamos nosotros, como 
psicólogos cognitivos y científicos cognitivos, mecanismos como la 
memoria, la atención, la categorización y la toma de decisiones, tienen 
todos un claro propósito evolutivo.» Explicó que, de vez en cuando, 
encontramos una conducta o un atributo en un organismo que carece de una 


clara base evolutiva; esto ocurre cuando fuerzas evolutivas propagan una 
adaptación por una razón determinada, y hay algo más que se incorpora al 
viaje, lo que Stephen Jay Gould llamó una «enjuta», en una expresión que 
tomó prestada de la arquitectura. En arquitectura, un diseñador podría 
planear una cúpula sostenida por cuatro arcos. Habrá necesariamente un 
espacio entre los arcos, no porque se hubiese planeado, sino porque es un 
subproducto del diseño. Las aves desarrollaron evolutivamente plumas para 
conservar el calor, pero las utilizaron también para otro propósito: volar. 
Eso es «una enjuta». 

Hay muchas enjutas de las que se hace tan buen uso que es difícil saber 
después si fueron o no adaptaciones. El espacio entre los arcos en un 
edificio se convirtió en un lugar donde se pintaban ángeles y se hacían otras 
decoraciones. La enjuta (un subproducto del diseño de los arquitectos) se 
convirtió en una de las partes más bellas de un edificio. Pinker aseguró que 
el lenguaje era una adaptación y la música su enjuta. Entre las operaciones 
cognitivas que realizan los humanos, la música es la que resulta menos 
interesante estudiar porque no es más que un subproducto, continuó 
diciendo, un accidente evolutivo que llegó a caballo del lenguaje. 

«La música es la tarta de queso auditiva —dijo despectivamente—. 
Sucede simplemente que cosquillea en varias partes importantes del cerebro 
de un modo sumamente agradable, igual que la tarta de queso cosquillea el 
paladar.» Los humanos no adquirieron evolutivamente un gusto por la tarta 
de queso, sino un gusto por las grasas y los azúcares, de los que hubo un 
suministro escaso durante nuestra historia evolutiva. Los humanos 
desarrollaron evolutivamente un mecanismo neuronal que hizo que nuestros 
centros de recompensa se activasen cuando comiésemos azúcares y grasas, 
porque en las pequeñas cantidades en que estaban disponibles, eran 
beneficiosos para nuestro bienestar. 

La mayoría de las actividades que son importantes para la supervivencia 
de las especies, como alimentarse y mantener relaciones sexuales, son 
también agradables; nuestros cerebros desarrollaron evolutivamente 
mecanismos para recompensar y fomentar esas conductas. Pero podemos 
aprender a puentear las actividades originales y acceder directamente a esos 
sistemas de recompensa. Podemos comer alimentos que carecen totalmente 


de valor nutritivo y tener relaciones sexuales sin procrear; podemos tomar 
heroína, que explota los receptores de placer normales del cerebro; nada de 
esto es adaptativo, pero los centros de placer del sistema límbico no 
conocen la diferencia. Los humanos, pues, descubrieron que la tarta de 
queso daba la casualidad que pulsaba botones de placer vinculados a la 
grasa y al azúcar, explicó Pinker, y la música es simplemente una conducta 
que busca placer explotando uno o más canales de placer existentes que se 
desarrollaron evolutivamente para reforzar un comportamiento adaptativo, 
de forma presumible, la comunicación lingúística. 

«La música —nos ilustró Pinker— pulsa botones de la habilidad 
lingúística (con la que la música se solapa de diversos modos); botones en 
el córtex auditivo, el sistema que responde a las señales emotivas de una 
voz humana que llora o arrulla, y el sistema de control motriz, que inyecta 
ritmo en los músculos cuando caminamos o bailamos.» 

«Por lo que se refiere a la causa y el efecto biológicos —escribió Pinker 
en El instinto del lenguaje (y lo parafraseó en la charla que nos dio)—, la 
música no tiene utilidad. No muestra indicio alguno de estar diseñada para 
alcanzar un objetivo, como por ejemplo larga vida, nietos, o una percepción 
y una predicción precisas del mundo. Comparada con el lenguaje, la visión, 
el razonamiento social y la pericia física, podría desaparecer de nuestra 
especie sin que el resto de nuestro estilo de vida apenas se modificase.» 

Cuando un científico brillante y respetado como Pinker hace una 
afirmación polémica, la comunidad científica toma nota, y a mí y a muchos 
de mis colegas eso nos hizo reevaluar nuestra posición sobre la base 
evolucionista de la música que habíamos dado por supuesta, sin ponerla en 
entredicho. Pinker nos obligó a pensar. Y un poco de investigación mostró 
que no es el único teórico que desdeña los orígenes evolutivos de la música. 
Para el cosmólogo John Barrow la música no tiene ningún papel en la 
supervivencia de la especie, y el psicólogo Dan Sperber la llamó «un 
parásito evolutivo». Sperber cree que desarrollamos evolutivamente una 
Capacidad cognitiva para procesar pautas sonoras complejas que varían en 
tono y duración, y que esta habilidad comunicativa surgió primero en 
humanos primitivos prelingúísticos. La música, según él, se desarrolló de 
forma parasitaria para explotar esa capacidad que había evolucionado para 


la verdadera comunicación. lan Cross, de la Universidad de Cambridge, lo 
resume así: «Para Pinker, Sperber y Barrow, la música existe simplemente 
por el placer que proporciona; su base es puramente hedonista». 

Sucede que yo creo que Pinker está equivocado, pero dejaré que las 
pruebas hablen por sí mismas. Dejadme que retroceda primero ciento 
cincuenta años hasta Charles Darwin. Ese latiguillo que a la mayoría de 
nosotros nos enseñaron en la escuela, «la supervivencia del más apto» 
(propagada por desgracia por el filósofo británico Herbert Spencer) 
simplifica demasiado la evolución. La teoría de la evolución se apoya en 
varios supuestos. Primero, todos los atributos fenotípicos del individuo (la 
apariencia, los atributos fisiológicos y algunas conductas) están codificados 
en los genes, que pasan de una generación a la siguiente. Los genes le dicen 
al cuerpo cómo hacer las proteínas, que generan nuestras características 
fenotípicas. La acción de los genes es específica de las células en las que 
reside; un gen determinado puede contener información que sea útil o no 
según la célula en cuestión: las células del ojo no necesitan desarrollar piel, 
por ejemplo. El genotipo (la secuencia particular de ADN) da origen al 
fenotipo (las características físicas particulares). Así que resumiendo: 
muchas de las formas en que difieren entre sí los miembros de una especie 
están codificadas en los genes, que se transmiten a través de la 
reproducción. 

El segundo supuesto de la teoría evolucionista es que existe entre 
nosotros cierta variabilidad genética natural. Tercero, cuando nos 
apareamos, el material genético se combina para formar un nuevo ser, que 
tendrá un cincuenta por ciento de material genético de cada progenitor. 
Finalmente, debido a errores espontáneos, se producen a veces confusiones 
o mutaciones que se pueden transmitir a la generación siguiente. 

Los genes que existen en ti hoy (con excepción de un pequeño número 
que pueden haber mutado) son los que se reprodujeron con éxito en el 
pasado. Cada uno de nosotros es un vencedor en una carrera de armamentos 
genética; muchos genes que no consiguieron reproducirse con éxito 
murieron, sin dejar descendientes. Todos los que hoy están vivos tienen 
genes que ganaron una competición genética a largo plazo y a gran escala. 
«Supervivencia del más apto» es una simplificación exagerada porque 


conduce al punto de vista distorsionado de que los genes que confieren una 
ventaja de supervivencia en su organismo anfitrión son los que ganarán la 
carrera genética. Pero vivir una larga vida, aunque sea feliz y productiva, no 
es algo que se transmita en los genes. Un organismo necesita reproducirse 
para transmitir sus genes. El nombre del juego evolucionista es reproducirse 
a toda costa, y procurar que los propios vástagos vivan para hacer lo mismo, 
y para que sus vástagos vivan lo suficiente para hacer lo mismo y así 
sucesivamente. 

Si un organismo vive lo suficiente para reproducirse y sus vástagos son 
sanos y están protegidos de modo que puedan hacer lo mismo, no hay 
ninguna razón evolutiva convincente para que el organismo viva mucho 
tiempo. Algunas especies de aves y de arañas mueren durante el 
apareamiento sexual o después. Los años posteriores al apareamiento no 
confieren ninguna ventaja para la supervivencia de los genes del organismo, 
salvo que éste sea capaz de utilizar ese tiempo para proteger a sus vástagos, 
asegurarles recursos o ayudarles a encontrar pareja. Así pues, hay dos cosas 
que llevan a que los genes «triunfen»: 1) que el organismo sea capaz de 
aparearse con éxito y transmita sus genes, y 2) que sus vástagos sean 
capaces de sobrevivir para hacer lo mismo. 

Darwin reconoció esta consecuencia de su teoría de la selección natural 
y propuso la idea de la selección sexual. Dado que un organismo debe 
reproducirse para transmitir sus genes, las cualidades que atraerán a la 
pareja deberían acabar codificadas en el genoma. Si una mandíbula 
cuadrada y unos bíceps muy grandes son rasgos atractivos en un hombre (a 
ojos de sus parejas potenciales), los hombres con esos rasgos se 
reproducirán con más éxito que sus competidores de mandíbula estrecha y 
brazos flacos. Los genes de la mandíbula cuadrada y el bíceps grande 
pasarán a ser por ello más abundantes. Los vástagos también necesitan que 
se les proteja de los elementos, de los predadores, de la enfermedad, y que 
se les proporcionen alimentos y otros recursos para que puedan 
reproducirse. Así pues, un gen que promueva esa conducta de colaboración 
en la cría después de la cópula podría también difundirse entre la población, 
en la medida en que a la descendencia de aquellos que tienen ese gen de 


colaboración en la cría les va mejor, como grupo, compitiendo por recursos 
y parejas. 

¿Podría jugar la música un papel en la selección sexual? Darwin 
pensaba que sí. En El origen del hombre dice: «Mi conclusión es que el 
ritmo y las notas musicales los adquirieron primero los progenitores 
masculinos o femeninos de la humanidad con el fin de atraer al sexo 
opuesto. Así, las notas musicales pasaron a asociarse firmemente con 
algunas de las pasiones más fuertes que es capaz de sentir un animal, y que 
se usan en consecuencia de forma instintiva...». Al buscar pareja, nuestro 
impulso innato es encontrar (consciente o inconscientemente) alguien que 
sea biológica y sexualmente apto, alguien que nos proporcione hijos que sea 
probable que sean sanos y capaces, para que puedan atraer a su vez a otras 
parejas. La música puede indicar aptitud biológica y sexual y servir para 
atraer al sexo Opuesto. 

Darwin creía que la música había precedido al lenguaje como medio de 
cortejo, y la equiparaba a la cola del pavo real. En su teoría de la selección 
sexual atribuyó la aparición de rasgos que no servían directamente a ningún 
propósito de supervivencia a conseguir que el individuo resultase atractivo 
(y con ello sus genes). El psicólogo cognitivo Geoffrey Miller ha 
relacionado esta idea con el papel que desempeña la música en la sociedad 
contemporánea. Jimi Hendrix tuvo «relaciones sexuales con centenares de 
fans, mantuvo relaciones paralelas de larga duración con dos mujeres al 
menos y engendró al menos tres hijos, en los Estados Unidos, Alemania y 
Suecia. En condiciones ancestrales previas al control de la natalidad, habría 
engendrado muchos más», escribe Miller. Robert Plant, el cantante 
principal de Led Zeppelin, recuerda su experiencia en sus grandes giras de 
conciertos de los años setenta: «Yo viajaba para amar. Siempre. Siguiese la 
ruta que siguiese, el coche se dirigía a una de las más grandes experiencias 
sexuales de mi vida». 

El número de parejas sexuales de las estrellas de rock puede ser cientos 
de veces mayor que el de un varón normal, y en el caso de las estrellas de 
rock más destacadas, como Mike Jagger, la apariencia física no parece tener 
importancia. 


Durante el cortejo sexual, los animales suelen publicitar la calidad de 
sus genes, su cuerpo y su mente con el fin de atraer a la mejor pareja 
posible. Muchas conductas específicamente humanas (como la 
conversación, la música, la habilidad artística y el humor) deben haberse 
desarrollado a lo largo de la evolución para publicitar sobre todo la 
inteligencia durante el cortejo. Miller indica que en las condiciones que 
debieron de existir a lo largo de la mayor parte de nuestra historia evolutiva, 
en que música y baile estaban completamente entrelazados, la habilidad 
para ambos debía de ser indicativa de aptitud sexual en dos frentes. 
Primero, cualquiera que fuese capaz de cantar y bailar estaba publicitando 
ante parejas potencíales su resistencia y su buena salud global, física y 
mental. En segundo lugar, todo el que se convirtiese en un experto O 
destacase en música y danza estaba publicitando que tenía alimento 
suficiente y un refugio lo bastante sólido para poder permitirse derrochar un 
tiempo valioso desarrollando una habilidad absolutamente innecesaria. Éste 
es el argumento de la bella cola del pavo real: el tamaño de la cola está 
correlacionado con la edad del animal, su salud y su buena condición física 
general. La cola colorista indica que el saludable pavo real tiene 
metabolismo para desperdiciar, que es tan apto, tan equilibrado, tan sano en 
términos de recursos que tiene de sobra y puede dedicar una parte a algo 
que sólo sirve para fines estéticos y de exhibición. 

En la sociedad contemporánea, vemos que sucede esto con la gente rica 
que construye casas suntuosas o conduce coches de cientos de miles de 
dólares. El mensaje de la selección natural es claro: elígeme. Tengo tantos 
alimentos y tantos recursos que puedo permitirme derrocharlos en esos 
artículos de lujo. No es ninguna casualidad que muchos hombres que viven 
en el nivel de pobreza o cerca de él en Estados Unidos se compren 
Cadillacs y Lincolns viejos, unos vehículos de estatus elevado que no son 
prácticos pero que indican inconscientemente la aptitud sexual de su 
propietario. Esto puede considerarse también el bling, la tendencia de los 
hombres a llevar joyas ostentosas. Que esa ansia y esa adquisición de 
coches y de joyas alcance su punto culminante en los hombres durante la 
adolescencia, cuando mayor es su potencia sexual, apoya la teoría. Hacer 
música, dado que exige una serie de habilidades físicas y mentales, sería un 


despliegue claro de salud, y tener tiempo para desarrollar esa habilidad 
musical, se argumenta, indicaría abundancia de recursos. 

En la sociedad contemporánea, el interés por la música alcanza también 
su punto culminante durante la adolescencia, lo que subraya más los 
aspectos de selección sexual de la música. Hay muchos más jóvenes de 
diecinueve años formando bandas e intentando introducirse en música 
nueva que hombres de cuarenta, aunque los de cuarenta hayan tenido más 
tiempo para desarrollar su habilidad musical y sus preferencias. «La música 
se desarrolló evolutivamente y sigue funcionando como un despliegue del 
cortejo, que exhiben sobre todo los machos jóvenes para atraer a las 
hembras», argumenta Miller. 

La música como exhibición de aptitud sexual no es una idea tan 
descabellada si tenemos en cuenta la forma que adoptaba la caza en algunas 
sociedades de cazadores-recolectores. Algunos protohumanos confiaban 
para la caza en la persistencia: arrojar lanzas, piedras y otros proyectiles 
contra su presa y luego perseguirla durante horas hasta que se desplomaba 
por las heridas y el agotamiento. Si el baile en las antiguas sociedades de 
cazadores-recolectores se parecía a lo que observamos en las 
contemporáneas, se prolongaba característicamente muchas horas y exigía 
por ello un gran esfuerzo aeróbico. Como exhibición de la aptitud de un 
varón para participar en una cacería o dirigirla, ese baile tribal sería un 
magnífico indicador. La mayoría de los bailes tribales incluyen alzar mucho 
los pies, pisar fuerte y saltar utilizando los músculos más grandes y más 
ávidos de energía del cuerpo. Hoy sabemos que muchas enfermedades 
mentales minan la habilidad para bailar o para moverse rítmicamente (la 
esquizofrenia y el Parkinson, por nombrar sólo dos), y así el tipo de música 
y baile rítmicos que ha caracterizado a la mayor parte de la música a lo 
largo de los siglos sirve como garantía de aptitud física y mental, e incluso 
quizá como garantía de habilidad y aplicación (porque, como vimos en el 
capítulo 7, para ser un experto hace falta un tipo determinado de 
concentración mental). 

Otra posibilidad es que la evolución seleccionase la creatividad en 
general como un indicador de aptitud sexual. La improvisación y lo 
novedoso en una sesión conjunta de música y danza indicaría la flexibilidad 


cognitiva del bailarín, mostrando su potencial para la astucia y la estrategia 
en la caza. La riqueza material de un pretendiente masculino ha sido 
considerada desde hace mucho tiempo uno de los atractivos más 
convincentes para las mujeres, que suponen que aumentará la probabilidad 
de que sus hijos dispongan de protección, cobijo y alimento abundantes. 
(Los ricos pueden conseguir más protección porque pueden solicitar el 
apoyo de otros miembros de la comunidad a cambio de alimentos o de 
muestras simbólicas de riqueza como las joyas o el dinero.) Si la riqueza 
fuese lo decisivo en el juego del cortejo, la música parecería relativamente 
intrascendente. Pero Miller y su colega Martie Haselton, de la Universidad 
de California, en Los Ángeles, han demostrado que la creatividad derrota a 
la riqueza, al menos en las hembras humanas. Su hipótesis es que mientras 
que la riqueza predice que tendremos un buen papá (para la crianza de los 
niños), la creatividad predice mejor quién proporcionará los mejores genes 
(para engendrar hijos). 

En un inteligente estudio, se preguntó a mujeres en diversas etapas de su 
ciclo menstrual (unas durante su punto culminante de fertilidad, otras en el 
punto mínimo y otras en un punto intermedio) que valorasen el atractivo de 
parejas potenciales basándose en viñetas escritas que describían a varones 
ficticios. Una viñeta típica describía a un hombre que era un artista, y que 
mostraba una gran inteligencia creadora en su trabajo, pero que era pobre 
debido a la mala suerte. Una viñeta alternativa describía a un hombre que 
tenía una inteligencia creadora media, pero que era rico debido a la buena 
suerte. Todas las viñetas estaban diseñadas para dejar claro que la 
creatividad de cada hombre estaba en función de sus rasgos y atributos (y 
era por tanto endógena, genética y heredable) mientras la situación 
económica de cada hombre era mayoritariamente accidental (y por tanto 
exógena y no heredable). 

Los resultados mostraron que cuando las mujeres estaban en el punto 
culminante de su fertilidad, preferían al artista creativo pero pobre en vez 
del hombre rico pero no creativo como pareja a corto plazo, o en un breve 
intercambio sexual. En otros períodos de su ciclo las mujeres no mostraban 
esas preferencias. Es importante tener en cuenta que las preferencias están 
en gran medida incorporadas y no son fácilmente dominables a través de 


cogniciones conscientes; el hecho de que las mujeres puedan hoy evitar el 
embarazo mediante un método de control de la natalidad casi infalible es 
algo demasiado reciente en nuestra especie como para que pueda influir en 
las preferencias innatas. Los hombres (y las mujeres) que podrían ser los 
mejores cuidadores no son necesariamente los que pueden aportar los 
mejores genes para los vástagos potenciales. La gente no siempre se casa 
con aquellos candidatos que les atraen más sexualmente, y el cincuenta por 
ciento de las personas de ambos sexos afirman que tienen aventuras 
extramaritales. Son muchas más las mujeres que quieren acostarse con 
estrellas de rock y atletas que las que quieren casarse con ellos. En suma, 
los mejores padres (en el sentido biológico) no siempre son los mejores 
papás (para la crianza de los niños). Esto puede explicar por qué, según un 
reciente estudio europeo, el diez por ciento de las madres dice que sus hijos 
estaban siendo criados por hombres que creían falsamente que los niños 
eran suyos. Aunque hoy la reproducción pueda no ser el motivo, es difícil 
separar nuestras preferencias innatas, derivadas del proceso evolutivo en la 
elección de pareja para el apareamiento, de nuestros gustos en cuanto a 
pareja sexual social y culturalmente condicionados. 

Para el musicólogo David Huron, de Ohio State, la cuestión clave para 
la base evolutiva es qué ventaja podría atribuirse a individuos que exhiben 
conductas musicales, frente a aquellos que no lo hacen. Si la música es una 
conducta anómala optativa en la que sólo se busca el placer (el argumento 
de la tarta de queso auditiva) sería lógico pensar que no habría durado 
mucho en la historia de la evolución. «Los consumidores de heroína — 
escribe Huron— tienden a descuidar su salud y es sabido que tienen 
elevados índices de mortalidad. Además, no son buenos padres; tienden a 
despreocuparse de sus hijos.» Que uno no cuide de la salud propia y la 
salud de sus hijos es un medio infalible de reducir la probabilidad de que 
los propios genes pasen a las generaciones futuras. En primer lugar, si la 
música fuese no adaptativa, los amantes de la música deberían hallarse en 
cierta desventaja evolutiva o de supervivencia. En segundo lugar, la música 
no debería haber durado mucho tiempo. Es improbable que cualquier 
actividad con un valor adaptativo pequeño se practique durante mucho 


tiempo en la historia de la especie, o que ocupe una porción significativa 
del tiempo y de las energías de un individuo. 

Todas las pruebas de que disponemos nos indican que la música no 
puede ser sólo tarta de queso auditiva; ha acompañado durante muchísimo 
tiempo a la especie. Los instrumentos musicales figuran entre los artefactos 
más antiguos fabricados por el hombre que se han encontrado. La flauta de 
hueso eslovena, fechada hace cincuenta mil años, hecha con el fémur de un 
oso europeo ya extinto, es un excelente ejemplo. La música precede a la 
agricultura en la historia de la especie. Podemos decir, como mínimo, que 
no hay ninguna prueba tangible de que el lenguaje precediese a la música. 
De hecho, las pruebas materiales sugieren lo contrario. La música es sin 
duda alguna más antigua que esa flauta de hueso de hace cincuenta mil 
años, porque no es verosímil que las flautas fuesen los primeros 
instrumentos. Es probable que diversos instrumentos de percusión, entre los 
que se incluyen los tambores, las maracas y las sonajas, se utilizasen miles 
de años antes que las flautas: lo comprobamos en las sociedades 
contemporáneas de cazadores-recolectores y en las descripciones de los 
invasores europeos que informaron de lo que encontraron en las culturas 
americanas nativas. El registro arqueológico muestra una presencia 
ininterrumpida de creación de música en todas las zonas en las que 
encontramos humanos, y en todas las épocas. Y, por supuesto, también el 
canto precedió probablemente a las flautas. 

Repitiendo el principio sumario de la biología evolutiva: «Las 
mutaciones genéticas que aumentan la probabilidad de que uno viva lo 
suficiente para reproducirse se convierten en adaptaciones». Según los 
mejores cálculos hace falta un mínimo de cincuenta mil años para que 
aparezca en el genoma humano una adaptación. A esto se le llama lapso 
evolutivo: el lapso temporal entre la primera aparición de una adaptación en 
una pequeña proporción de individuos y el momento en que pasa a 
distribuirse ampliamente en la población. Cuando los  genetistas 
conductistas y los psicólogos evolucionistas buscan una explicación 
evolutiva a nuestras conductas O nuestra apariencia, consideran qué 
problema evolutivo se estaba intentando resolver con la adaptación en 
cuestión. Pero debido al lapso evolutivo, la adaptación en cuestión habría 


sido una reacción a esas condiciones tal como eran cincuenta mil años atrás, 
no como son hoy. Nuestros ancestros cazadores-recolectores tenían un 
estilo de vida muy diferente al de cualquiera que esté leyendo este libro, 
con presiones y prioridades diferentes. Muchos de los problemas a los que 
nos enfrentamos hoy (cánceres, enfermedades cardíacas, tal vez incluso la 
elevada tasa de divorcios) han venido a atormentarnos porque nuestros 
cuerpos y nuestros cerebros estaban diseñados para manejar la vida de la 
forma que era para nosotros hace cincuenta mil años. Dentro de cincuenta 
mil años, en 52.006 (milenio más o menos), nuestra especie tal vez haya 
evolucionado por fin para manejar la vida tal como es ahora, con ciudades 
superpobladas, contaminación del aire y del agua, videojuegos, poliéster, 
donuts glaseados y un gran desequilibrio mundial en la distribución de 
recursos. Podemos desarrollar evolutivamente mecanismos mentales que 
nos permitan vivir unos al lado de otros sin sentir una pérdida de intimidad, 
y mecanismos fisiológicos para procesar monóxido de carbono, desechos 
radiactivos y azúcar refinado, y podemos aprender a utilizar recursos que 
hoy son inutilizables. 

Cuando preguntamos por la base evolutiva de la música, no sirve de 
nada pensar en Britney o en Bach. Tenemos que pensar en cómo era la 
música hace unos cincuenta mil años. Los instrumentos recuperados en los 
yacimientos arqueológicos pueden ayudarnos a entender lo que utilizaban 
nuestros ancestros para hacer música, y qué tipos de melodías escuchaban. 
Las pinturas de las cuevas, sobre cerámica de gres y otros restos históricos 
pueden explicarnos algo del papel que tenía la música en la vida cotidiana. 
Podemos estudiar también sociedades contemporáneas que han estado 
aisladas de la civilización tal como la conocemos, grupos de gentes que 
viven como cazadores-recolectores y que se han mantenido invariables 
durante miles de años. Un descubrimiento sorprendente es que en todas las 
sociedades de las que tenemos noticia, la música y la danza son 
inseparables. 

Los argumentos contra la música como una adaptación la consideran 
sólo un sonido desencarnado y, además, algo interpretado por una clase 
experta para un público. Pero la música se ha convertido en una actividad 
de espectador sólo en los últimos quinientos años: la idea de un concierto 


musical en el que una clase de «expertos» actuaba para una audiencia 
apreciativa es algo completamente desconocido a lo largo de nuestra 
historia como especie. Y sólo en los últimos cien años se han minimizado 
los vínculos entre el sonido musical y el movimiento humano. El carácter 
de la música como algo vinculado al cuerpo, el carácter indivisible de 
movimiento y sonido, escribe el antropólogo John Blacking, caracteriza a la 
música a través de las culturas y a través de las épocas. La mayoría de 
nosotros nos quedaríamos estupefactos si los miembros del público de un 
concierto sinfónico se levantaran de sus sillas y empezaran a batir palmas, a 
gritar, a armar jaleo y a bailar, como es de rigor en un concierto de James 
Brown. Pero la reacción a James Brown está sin duda alguna más próxima a 
nuestra verdadera naturaleza. Esa reacción de escuchar de forma respetuosa, 
en la que la música se ha convertido en una experiencia absolutamente 
cerebral (hasta las emociones de la música han de sentirse, en la tradición 
clásica, interiormente y no deben causar ningún arrebato físico) es contraria 
a nuestra historia evolutiva. Los niños muestran a menudo la reacción que 
se corresponde con nuestra auténtica naturaleza: se mueven y gritan y 
participan en general cuando sienten ganas de hacerlo, incluso en conciertos 
de música clásica. Hay que educarles para que se  comporten 
«cCivilizadamente». 

Cuando una conducta o un rasgo está ampliamente distribuido entre los 
miembros de una especie, consideramos que está codificado en el genoma 
(de forma independiente de si fue una adaptación o una enjuta). Blacking 
dice que la distribución universal de la habilidad para hacer música en las 
sociedades africanas parece indicar que «la habilidad musical [es] una 
característica general de la especie humana, más que un raro talento». Más 
importante aún, Cross escribe que «la habilidad musical no se puede definir 
sólo en términos de competencia productiva»; casi todos los miembros de 
nuestra sociedad son capaces de escuchar música y por tanto de entenderla. 

Aparte de esos factores sobre la ubicuidad, la historia y la anatomía de 
la música, es importante comprender cómo y por qué se seleccionó la 
música. Darwin propuso la hipótesis de la selección sexual, que ha sido 
expuesta más recientemente por Miller y otros. Se han alegado también 
posibilidades adicionales. Una es la vinculación y cohesión social. 


Interpretar música de forma colectiva puede fomentar conexiones sociales: 
los humanos son animales sociales y la música puede haber servido 
históricamente para fomentar sentimientos de unidad y sincronía del grupo 
y haber sido un ejercicio para otros actos sociales como las conductas de 
turnarse para hablar. Cantar alrededor del antiguo fuego de campamento 
podría haber sido un medio de mantenerse despierto, de protegerse de los 
predadores y de desarrollar coordinación social y cooperación dentro del 
grupo. Los humanos necesitan vínculos sociales para hacer funcionar la 
sociedad, y la música es uno de ellos. 

Una vía intrigante de investigación a partir de la música como medio de 
vinculación social es la relacionada con mi trabajo junto a Ursula Bellugi 
con afectados por trastornos mentales como el síndrome de Williams (SW) 
y por los trastornos del espectro del autismo (ASD, según sus siglas en 
inglés). Como vimos en el capítulo 6, el síndrome de Williams tiene origen 
genético y provoca un desarrollo cognitivo y neuronal anormal, que tiene 
como consecuencia una discapacidad intelectual. A pesar de su 
discapacidad mental general, los afectados por el síndrome de Williams son 
muy sensibles a la música y muy sociables. 

Contrastan con ellos los que padecen trastornos del espectro del 
autismo, muchos de los cuales sufren también discapacidad intelectual. 
Sigue siendo un tema controvertido si los trastornos de este género tienen o 
no una base genética. Un indicador de los trastornos del espectro del 
autismo es la incapacidad para identificarse con los demás, para entender 
las emociones o la comunicación emotiva, sobre todo las emociones de los 
otros. Los que los padecen sin duda se pueden mostrar furiosos y alterados, 
no son robots. Pero su capacidad para «leer» las emociones de los demás 
está significativamente perturbada, lo que se extiende de forma 
característica a una incapacidad total para apreciar las cualidades estéticas 
del arte y de la música. Aunque algunas personas con trastornos del 
espectro de autismo interpretan música y algunas han llegado a un alto nivel 
de pericia técnica, la música no les conmueve emotivamente. Las pruebas 
preliminares y sobre todo anecdóticas indican más bien que lo que les atrae 
es la estructura de la música. Temple Grandin, una profesora que es autista, 
ha escrito que la música le parece «bonita» pero que en general, 


simplemente «no la capta» y no entiende por qué la gente reacciona con ella 
como lo hace. 

El síndrome de Williams y los trastornos del espectro del autismo son 
dos síndromes complementarios. Por una parte tenemos una población que 
es sumamente sociable, gregaria y muy musical. Por la otra, una población 
antisocial y poco musical. El supuesto vínculo entre música y cohesión 
social lo refuerzan casos complementarios como éstos, lo que los 
neurocientíficos llaman una doble disociación. El argumento es que tiene 
que haber un conjunto de genes que influye tanto en la extroversión como 
en la musicalidad. Si esto fuese cierto, podría esperarse que las desviaciones 
en una habilidad coincidieran con desviaciones en la otra, como vemos en 
el síndrome de Williams y los desórdenes del espectro del autismo. 

Los cerebros de los afectados por el síndrome de Williams y por los 
desórdenes del espectro del autismo revelan también, como podría 
esperarse, discapacidades complementarias. Allan Reiss ha demostrado que 
el neocerebelo, la parte más reciente del cerebelo, es mayor de lo normal en 
las personas con síndrome de Williams y más pequeño de lo normal en las 
que padecen trastornos del espectro del autismo. Esto no es sorprendente, si 
tenemos en cuenta lo que ya sabemos sobre el importante papel que juega el 
cerebelo en la cognición musical. Parece haber alguna anormalidad genética 
todavía no identificada que causa, directa oO indirectamente, la 
dismorfología neuronal del síndrome de Williams, y suponemos que 
también la de los trastornos del espectro del autismo. Esto conduce, a su 
vez, a un desarrollo anormal de las conductas musicales, que en un caso se 
potencian y en el otro se reducen. 

Debido al carácter complejo e interactivo de los genes, es seguro que 
hay otras correlaciones genéticas de la sociabilidad y la musicalidad que 
van más allá del cerebelo. La genetista Julie Korenberg ha propuesto la 
existencia de un conjunto de genes relacionados con la extroversión o la 
introversión, y que los afectados por el síndrome de Williams carecerían de 
algunos de los genes inhibidores normales que tenemos todos los demás, lo 
que haría sus conductas musicales más desinhibidas; durante toda una 
década en informes anecdóticos basados en relatos en el noticiario 60 
Minutes de la CBS, en una película narrada por Oliver Sacks sobre 


Williams y en una gran cantidad de artículos de prensa, se ha asegurado que 
las personas que padecen el síndrome de Williams se vinculan más a la 
música, y están más inmersos en ella que la mayoría de la gente. Mi propio 
laboratorio ha aportado pruebas neuronales sobre este hecho. Hicimos 
escáners cerebrales a afectados por el síndrome de Williams después de que 
oyesen música y descubrimos que estaban utilizando un conjunto de 
estructuras neurales muchísimo mayor que el que usan todos los demás. La 
activación de la amígdala y del cerebelo (los centros emotivos del cerebro) 
era significativamente más fuerte que en las personas sin síndrome. Había 
dondequiera que mirábamos una activación neuronal más intensa y más 
ampliamente difundida. Sus cerebros zumbaban. 


Un tercer argumento en favor de la primacía de la música en la evolución 
humana (y protohumana) es que la música se desarrolló evolutivamente 
porque fomentaba el desarrollo cognitivo. La música pudo ser la actividad 
que preparó a nuestros ancestros prehumanos para la comunicación verbal y 
para la propia flexibilidad cognitiva y de representación necesaria para 
convertirse en humanos. El canto y las actividades instrumentales podrían 
haber ayudado a nuestra especie a perfeccionar habilidades motrices, 
preparando el camino para el desarrollo del control muscular 
exquisitamente delicado que se necesita para el lenguaje vocal o de señas. 
Como la música es una actividad compleja, Trehub opina que puede ayudar 
a preparar al niño de pecho, en proceso de desarrollo, para su vida mental 
futura. Comparte muchos de los rasgos del lenguaje y puede establecer un 
medio de «practicar» la percepción del lenguaje en un marco diferenciado. 
Ningún ser humano ha aprendido nunca el lenguaje por memorización. Los 
bebés no se limitan a memorizar cada palabra y cada frase que han oído; 
aprenden más bien reglas y las aplican para la percepción y la generación de 
nuevo lenguaje. Hay dos pruebas de lo anterior, una empírica y otra lógica. 
La prueba empírica procede de lo que los lingiistas llaman sobreextensión: 
los niños que están aprendiendo las reglas del lenguaje las aplican a 
menudo de forma lógica pero incorrecta. Donde se ve más claro esto es en 
el caso de la conjugación los verbos irregulares. El cerebro en desarrollo se 
apresta a establecer muevas conexiones neuronales y a podar otras viejas 


que ya no son útiles o no son exactas, y su misión es asentar las reglas en la 
medida de lo posible. Por eso oímos a los niños pequeños decir «No lo he 
hacido», en vez de «No lo he hecho». Están aplicando una regla lógica: en 
la mayoría de los verbos cuyo infinitivo termina en er el participio termina 
en -ido: nacer/nacido, beber/bebido, tejer/tejido. Una aplicación razonable 
de la regla conduce a sobreextensiones como esa. De hecho, es más 
probable que cometan estos errores los niños más inteligentes y que los 
cometan antes en el curso de su desarrollo, porque tienen un sistema 
generador de reglas más perfeccionado. Como son muchísimos los niños 
que cometen esos errores lingúísticos y pocos los adultos que lo hacen, el 
hecho demuestra que los niños no están simplemente remedando lo que 
oyen, sino que sus cerebros están desarrollando teorías y reglas sobre 
lenguaje que ellos luego aplican. 

La segunda prueba de que los niños no se limitan a memorizar el 
lenguaje es lógica: todos nosotros decimos frases que no hemos oído nunca. 
Podemos formar un número infinito de frases para expresar pensamientos e 
ideas que no hemos expresado antes ni hemos oído expresar: es decir, el 
lenguaje es generativo. Los niños deben aprender las reglas gramaticales 
generando frases únicas para convertirse en hablantes competentes de su 
idioma. Un ejemplo trivial de que el número de frases del lenguaje humano 
es infinito es que a cada frase que me digas, siempre puedo añadirle al 
principio «no creo» y hacer una frase nueva. «Me gusta la cerveza» se 
convierte en «no creo que me guste la cerveza». «Mary dice que le gusta la 
cerveza» se convierte en «no creo que Mary diga que le gusta la cerveza». 
Hasta «no creo que Mary diga que le gusta la cerveza» se convierte en «no 
creo que no crea que Mary diga que le gusta la cerveza». Aunque una frase 
como ésta es torpe, eso no altera el hecho de que expresa una nueva idea. Al 
ser el lenguaje generativo, los niños no pueden aprenderlo de memoria. La 
música también es generativa. A cada frase musical que oigo, siempre 
puedo añadirle una nota al principio, al final o en medio y generar una frase 
musical nueva. 

Cosmides y Tooby sostienen que la función de la música en el niño en 
desarrollo es ayudar a preparar su mente para una serie de actividades 
sociales y cognitivas complejas, ejercitando el cerebro de manera que esté 


preparado para las exigencias que le plantean el lenguaje y la interacción 
social. El hecho de que la música carezca de referentes específicos la 
convierte en un sistema simbólico seguro para expresar estados de ánimo y 
sentimientos sin que haya confrontación. El procesamiento de la música 
ayuda a los niños pequeños a prepararse para el lenguaje; debe disponer el 
camino para la prosodia lingúística, antes incluso de que el cerebro en 
desarrollo del niño esté en condiciones de procesar la fonética. El desarrollo 
de la música opera como una forma de juego, un ejercicio que invoca 
procesos integradores de nivel más elevado que alimentan la competencia 
exploratoria, preparando al niño para explorar cuando llegue el momento el 
desarrollo de lenguaje generativo a través del balbuceo y finalmente de 
manifestaciones lingúísticas y paralingúísticas más complejas. 

Las interacciones madre-niño que incluyen la música casi siempre 
entrañan canto y movimiento rítmico, como cuando la madre acuna al bebé 
o lo acaricia. Esto parece ser común a todas las culturas. Durante más o 
menos los primeros seis meses de vida, como mostré en el capítulo 7, el 
cerebro del niño es incapaz de distinguir con claridad la fuente de las 
impresiones sensoriales; la visión, el oído y el tacto se mezclan en una 
representación perceptiva unitaria. Las regiones del cerebro que acaban 
convirtiéndose en el córtex auditivo, el córtex sensorial y el córtex visual 
están indiferenciadas funcionalmente y las impresiones que reciben los 
diversos receptores sensoriales deben conectarse a muchas partes distintas 
del cerebro, hasta que se produzca la poda en una época posterior de la 
vida. Según la descripción de Simon Baron-Cohen, el niño, con toda esta 
charla sensorial cruzada, vive en un estado de pleno esplendor psicodélico 
(sin la ayuda de drogas). 

Cross reconoce de forma explícita que en lo que la música se ha 
convertido hoy con la influencia de la época y de la cultura, no es 
necesariamente lo que era hace cincuenta mil años, ni debería esperarse que 
lo fuese. Pero un análisis del carácter de la música antigua explica por qué a 
tantos nos conmueve literalmente el ritmo; según casi todas las referencias 
la música de nuestros remotos ancestros era muy rítmica. El ritmo agita el 
cuerpo. La tonalidad y la melodía agitan el cerebro. La agrupación de ritmo 
y melodía tiende un puente entre el cerebelo (el control motriz, el pequeño 


cerebro primitivo) y el córtex central (la parte más evolucionada y más 
humana del cerebro). Así es como el Bolero de Ravel, «Koko» de Charlie 
Parker o «Honky Tonk Women» de los Rolling Stones nos inspiran y nos 
conmueven, tanto metafórica como físicamente, con exquisitas uniones de 
compás y espacio melódico. Por eso el rock, el heavy metal y el hip-hop 
son los géneros musicales más populares del mundo, y lo han sido durante 
los últimos veinte años. Mitch Miller, el cazatalentos jefe de Columbia 
Records, dijo en una frase célebre que el rock and roll era una moda que 
pronto moriría. Hoy, en 2006, no hay indicio alguno de que su popularidad 
disminuya. Ya no se compone música clásica, tal como la mayoría de 
nosotros la concebimos (es decir, desde 1575 a 1959, desde Monteverdi a 
Bach a Stravinsky, Rachmaninoff y demás). Los compositores 
contemporáneos de los conservatorios de música no componen ya ese tipo 
de música como norma, sino que escriben más bien lo que muchos 
denominan música de arte del siglo xx (ahora del siglo xx1). Y tenemos así 
a Philip Glass y John Cage y compositores más recientes y menos 
conocidos cuya música raras veces interpretan nuestras orquestas 
sinfónicas. Cuando Copeland y Bernstein componían, las orquestas 
interpretaban sus obras y el público las disfrutaba. Esto ha ido sucediendo 
Cada vez menos en los últimos cuarenta años. La música «clásica» 
contemporánea se practica primordialmente en las universidades; no la 
escucha casi nadie; deconstruye la armonía, la melodía y el ritmo, 
haciéndolos casi irreconocibles; es un ejercicio puramente intelectual y, 
salvo alguna rara compañía de ballet de vanguardia, tampoco la baila nadie. 

Un cuarto argumento en apoyo de la música como adaptación nos lo 
aportan otras especies. Si podemos demostrar que otras especies utilizan la 
música con fines similares, tal hecho constituye un firme argumento 
evolutivo. Pero es especialmente importante no antropomorfizar conductas 
animales, interpretándolas sólo desde nuestra perspectiva cultural. Lo que a 
nosotros nos suena como música o como una canción puede tener para los 
animales una función muy diferente de la que tiene para nosotros. Cuando 
vemos que un perro se echa a rodar en la hierba fresca en verano, con una 
Cara de satisfacción perruna, pensamos: «Qué contento está Spike». 
Estamos interpretando su conducta de acuerdo con lo que sabemos de 


nuestra especie, sin pararnos a considerar que podría significar algo distinto 
para Spike y para la suya. Los niños humanos se echan a rodar en la hierba, 
dan volteretas y hacen cabriolas cuando están contentos. Los perros se 
echan a rodar en la hierba cuando descubren en ella un olor particularmente 
acre, con preferencia de un animal que haya muerto hace poco, y cubren su 
piel con ese olor para que los otros perros piensen que son unos magníficos 
cazadores. El canto de un pájaro puede parecernos asimismo muy alegre, 
pero puede que el cantor no se propusiese dar esa impresión ni sea así como 
lo interpreta el pájaro que lo escuche. 

Sin embargo, de todas las llamadas de otras especies, el canto de los 
pájaros ocupa una posición especial debido a lo que nos sobrecoge e intriga. 
¿Quién no ha oído el canto de un pájaro una mañana de primavera y le ha 
parecido cautivadora su belleza, su melodía, su estructura? Aristóteles y 
Mozart figuran entre los que sintieron esa sensación; consideraron que los 
cantos de los pájaros eran tan musicales como las composiciones de los 
humanos. Pero ¿por qué escribimos o interpretamos música? ¿Son nuestras 
motivaciones diferentes de las de los animales? 

Las aves, las ballenas, los gibones, las ranas y otras especies utilizan 
vocalizaciones con diversos propósitos. Los chimpancés y los perrillos de la 
pradera tienen llamadas de alerta para avisar a sus semejantes de que se 
aproxima un predador, y las llamadas son específicas para ese predador. Los 
chimpancés utilizan una vocalización para indicar que se aproxima un 
águila (alertando a sus camaradas primates para que se oculten debajo de 
algo) y otra para comunicar la incursión de una serpiente (alertando a sus 
amigos para que se suban a un árbol). Los machos de las aves utilizan sus 
vocalizaciones para establecer territorio; los petirrojos y los cuervos 
reservan una llamada especial para avisar de predadores como perros y 
gatos. 

Otras vocalizaciones animales están más claramente relacionadas con el 
cortejo. Entre los pájaros cantores, es generalmente el macho de la especie 
el que canta, y en algunas especies cuanto más grande es el repertorio más 
probable es que atraiga a una hembra. Sí, para las hembras de pájaros 
cantores, el tamaño importa; es indicativo del intelecto del macho y, por 
tanto, de una fuente de genes potencialmente buenos. Esto se demostró en 


un estudio que emitió por altavoces diferentes cantos dirigidos a pájaros 
hembra. Estas ovulaban más rápidamente con un repertorio más grande de 
cantos que en presencia de uno pequeño. Algunos machos de pájaros 
cantores son capaces de continuar con su canto de cortejo hasta caer 
muertos de agotamiento. Los lingúistas señalan el carácter generativo de la 
música humana, la capacidad que tenemos de crear nuevas canciones a 
partir de sus elementos componentes de una forma casi ilimitada. Ése no es 
tampoco un rasgo exclusivamente humano. Varias especies de aves generan 
sus canciones partiendo de un repertorio de sonidos básicos, y componen 
nuevas melodías y variaciones sobre ellas, y el macho que canta los cantos 
más elaborados es en general el que tiene más éxito en el apareamiento. La 
función de la música en la selección sexual tiene así un análogo en otras 
especies. 

El origen evolutivo de la música está demostrado porque está presente 
en todos los humanos (cumpliendo el criterio de los biólogos de estar 
extendido en la especie); lleva presente mucho tiempo (lo que refuta la idea 
de que es sólo tarta de queso auditiva); involucra estructuras cerebrales 
especializadas, incluyendo sistemas mnemotécnicos asignados que pueden 
seguir siendo funcionales cuando otros sistemas mnemotécnicos fallan 
(cuando un sistema cerebral físico se desarrolla en todos los humanos, 
consideramos que tiene una base evolutiva), y es análoga a la música que 
hacen otras especies. Las secuencias rítmicas excitan óptimamente redes 
neuronales recurrentes en los cerebros de los mamíferos, incluyendo 
circuitos retroalimentados entre el córtex motriz, el cerebelo y las regiones 
frontales. Los sistemas tonales, las transiciones de altura y los acordes se 
apoyan sobre ciertas propiedades del sistema auditivo que son producto a su 
vez del mundo físico, de la naturaleza intrínseca de los objetos vibratorios. 
El sistema auditivo se desarrolló de formas que se apoyan en la relación 
entre escalas y series armónicas. La novedad musical atrae la atención y 
vence el aburrimiento, lo que la hace más recordable. 


El descubrimiento del gen, sobre todo el descubrimiento de la estructura del 
ADN por Watson y Crick, revolucionó la teoría de la selección natural de 


Darwin. Tal vez seamos testigos de otra revolución en el aspecto de la 
evolución que se basa en la conducta social, en la cultura. 

Es indudable que uno de los descubrimientos más citados en 
neurociencia en los últimos veinte años fue el de neuronas especulares en el 
cerebro primate. Giacomo Rizzolatti, Leonardo Fogassi y Vittorio Gallese 
estaban estudiando los mecanismos cerebrales responsables de movimientos 
como extender el brazo y asir en los monos. Leyeron el producto de una 
sola neurona en el cerebro del mono cuando extendía la mano para coger 
trozos de comida. En determinado momento, Fogassi fue a coger un plátano 
y la neurona del mono (una que había sido asociada ya con el movimiento) 
empezó a activarse. «¿Cómo pudo pasar eso si el mono no se movió?», 
recuerda Rizzolatti que pensó. «Al principio creímos que era un fallo de 
nuestra medición o tal vez un fallo del equipo, pero lo comprobamos y todo 
estaba bien, y la reacción se repitió cuando repetimos el movimiento.» Una 
década de trabajo ha demostrado después que los primates, como las aves y 
los humanos, tienen neuronas especulares, neuronas que se activan cuando 
realizan una acción y cuando observan que algún otro está realizando esa 
acción. 

La finalidad de las neuronas especulares parece ser adiestrar y preparar 
el organismo para hacer movimientos que no ha hecho antes. Hemos 
encontrado neuronas especulares en el área de Broca, una parte del cerebro 
íntimamente relacionada con el lenguaje y el aprendizaje del habla. Las 
neuronas especulares pueden explicar un viejo misterio, el de cómo 
aprenden los niños pequeños a imitar las muecas que les hacen sus padres. 
Pueden también explicar por qué el ritmo musical nos conmueve, tanto 
emotiva como físicamente. No tenemos aún pruebas sólidas, pero algunos 
neurocientíficos piensan que nuestras neuronas especulares pueden 
activarse cuando vemos y oímos actuar a los músicos, mientras el cerebro 
intenta adivinar cómo se están creando esos sonidos, como preparación para 
poder reflejarlos o repetirlos como parte de un sistema de señales. Muchos 
músicos pueden repetir una pieza musical en sus instrumentos después de 
haberla oído sólo una vez. Es probable que las neuronas especulares 
colaboren en esta habilidad. 


Los genes son los que transmiten las recetas de la proteína entre los 
individuos y a través de las generaciones. Tal vez las neuronas especulares, 
ahora junto con las partituras, los CD y los iPod resultarán ser los 
mensajeros fundamentales de la música a través de individuos y 
generaciones, permitiendo ese tipo especial de evolución (la evolución 
cultural) por medio de la cual se desarrollan las creencias, las obsesiones y 
todo el arte. 

Para muchas especies solitarias la capacidad de ritualizar ciertos 
indicios de una buena forma física en un despliegue de cortejo tiene sentido, 
ya que los miembros de una pareja potencial sólo pueden verse durante 
unos minutos. Pero en sociedades sumamente sociales como las nuestras, 
¿qué necesidad podría haber de indicar una buena forma física a través de 
medios tan sumamente estilizados y simbólicos como el baile y el canto? 
Los humanos viven en grupos sociales y tienen numerosas oportunidades de 
observarse en una diversidad de situaciones y durante largos períodos de 
tiempo. ¿Por qué iba a ser necesaria la música para mostrar aptitud? Los 
primates son sumamente sociables, viven en grupos y establecen complejas 
relaciones a largo plazo que incluyen estrategias sociales. El cortejo 
homínido probablemente fuese una relación a largo plazo. La música, 
especialmente la música recordable, se insinuaría en la mente de una pareja 
potencial, llevándola a pensar en su pretendiente incluso cuando él 
estuviese fuera en una larga cacería y predisponiéndola hacia él cuando 
volviese. Los múltiples vínculos reforzadores de una buena canción (ritmo, 
melodía, contorno) hacen que la música se nos quede en la cabeza. Ésa es la 
razón de que a muchos mitos antiguos y epopeyas e incluso al Antiguo 
Testamento se les pusiese música con vistas a transmitirlos por tradición 
oral a lo largo de las generaciones. Como instrumento de activación de 
pensamientos específicos, la música no es tan buena como el lenguaje. 
Como un instrumento para despertar sentimientos y emociones, la música 
es mejor que el lenguaje. La combinación de ambos (en su mejor ejemplo, 
la canción de amor) es el mejor de todos los ceremoniales del cortejo. 


APÉNDICE A 


TU CEREBRO Y LA MÚSICA 


El procesamiento de la música está distribuido por todo el cerebro. Las 
figuras de las dos páginas siguientes muestran los principales centros 
computacionales del cerebro para la música. La primera ilustración es una 
vista lateral del cerebro. La parte frontal del cerebro está a la izquierda. La 
segunda ilustración muestra el interior del cerebro desde el mismo punto de 
vista que la primera ilustración. Estas figuras se basan en ilustraciones de 
Mark Tramo publicadas en Science en 2001, pero se han redibujado y se ha 
incluido información más reciente. 
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APÉNDICE B 


ACORDES Y ARMONÍA 


Dentro de la tonalidad de do, los únicos acordes legales son acordes 
construidos fuera de las notas de la escala en do mayor. Esto hace que 
algunos acordes sean mayores y algunos menores, debido al espadamiento 
desigual de tonos en la escala. Para construir el acorde de tres notas 
estándar (un acorde triádico) empezamos con cualquiera de las notas de la 
escala en do mayor, saltamos una, y luego utilizamos la siguiente, luego 
volvemos a saltar una y utilizamos la siguiente a ésa. El primer acorde en 
do mayor, pues, viene de las notas do-mi-sol, y debido a que el primer 
intervalo formado, entre do y mi, es una tercera mayor, llamamos a este 
acorde un acorde mayor, y en particular un acorde de do mayor. El siguiente 
lo construimos de forma similar y está compuesto por re-fa-la. Como el 
intervalo entre re y fa es una tercera menor, este acorde se llama un acorde 
de re menor. Recuerda que los acordes mayores y los acordes menores 
tienen un sonido muy distinto. Aunque la mayoría de los que no son 
músicos no puedan nombrar un acorde al oírlo, o etiquetarlo como mayor o 
menor, si oyen un acorde mayor y menor juntos pueden apreciar la 
diferencia. Y desde luego sus cerebros la aprecian: una serie de estudios han 
demostrado que producen reacciones fisiológicas diferentes ante los acordes 
mayores y menores y los tonos mayores y menores. 

En la escala mayor, considerando los acordes triádicos construidos de la 
forma estándar que acabamos de describir, tres son mayores (en los grados 
primero, cuarto y quinto de la escala), tres son menores (en los grados 
segundo, tercero y sexto) y están compuestos de dos intervalos y una tercera 
menor. La razón de que digamos que estamos en la tonalidad de do mayor, 


aunque haya tres acordes menores en ella, se debe a que el acorde raíz (el 
acorde hacia el que apunta la música, el que parece «casa») es do mayor. 

Los compositores usan en general acordes para establecer un estado de 
ánimo. El uso de acordes y cómo están ligados unos con otros se llama 
armonía. Otro uso, tal vez más conocido, de la palabra armonía es para 
indicar cuándo dos o más cantantes o instrumentistas están interpretando 
juntos y no están dando las mismas notas, pero conceptualmente se trata de 
la misma idea. Algunas progresiones de acordes se utilizan más que otras, y 
pueden convertirse en características de un género determinado. Por 
ejemplo, el blues está definido por una secuencia determinada de acordes: 
un acorde mayor en el primer grado de la escala (que se escribe I mayor) 
seguido de un acorde mayor en el cuarto grado de la escala (que se escribe 
IV mayor) seguido de nuevo por I mayor, luego V mayor, con opción a IV 
mayor, luego vuelta a I mayor. Ésta es la progresión estándar del blues, que 
aparece en canciones como «Crossroads» (Robert Johnson, substituido más 
tarde por Cream), «Sweet Sixteen» por B. B. King, y «lI Hear You 
Knockin”» (en grabación de Smiley Lewis, Big Joe Turner, Screamin” Jay 
Hawkins y Dave Edmunds). La progresión del blues (ya sea literal o con 
algunas variaciones) es la base de la música rock y se encuentra en miles de 
canciones, entre ellas «Tutti Frutti» de Little Richard, «Rock and Roll 
Music» de Chuck Berry, «Kansas City» de Wilbert Marrison, «Rock and 
Roll» de Led Zeppelin, «Jet Airliner» de la Steve Miller Band (que es 
sorprendentemente similar a «Crossroads») y «Get Back» de los Beatles. 
Artistas de jazz como Miles Davis y artistas de rock progresivo como 
Steely Dan han escrito docenas de canciones que están inspiradas por esta 
progresión, con sus propias formas creadoras de sustituir los tres acordes 
estándar por otros más exóticos; pero aunque engalanadas con acordes más 
elegantes, siguen siendo progresiones de blues. 

La música bebop se inclinó predominantemente por una determinada 
progresión compuesta originalmente por George Gershwin para la canción 
«D've Got Rhythm». En la tonalidad de do, los acordes básicos serían: 


Do mayor-la menor-re menor-sol 7-do mayor-la menor-re menor-sol 7 
Do mayor-do 7-fa mayor-fa menor-do mayor-sol 7-do mayor 


Do mayor-la menor-re menor-sol 7-do mayor-la menor-re menor-sol 7 
Do mayor-do 7-fa mayor-fa menor-do mayor-sol 7-do mayor 


El 7 junto a una nota indica una tétrada (un acorde de cuatro notas) que 
es simplemente un acorde mayor con una cuarta nota añadida encima; la 
nota de encima es una tercera menor por encima de la nota tercera del 
acorde. El acorde de sol 7 se llama bien «sol séptima» o «sol séptima 
dominante». En cuanto empezamos a utilizar tétradas en vez de tríadas para 
los acordes, es posible una gran cantidad de rica variación tonal. El rock y 
el blues tienden a utilizar sólo el séptima dominante, pero hay otros dos 
tipos de acordes de «séptima» que son de uso común, y que transmiten cada 
uno de ellos un aroma emotivo diferente. «Tin Man» y «Sister Golden 
Hair» del grupo America utilizan el acorde séptima mayor para dar su 
sonido característico (una tríada mayor con una tercera mayor encima, en 
vez de la tercera menor del acorde que estamos llamando séptima 
dominante); «The Thrill Is Gone» de B. B. King utiliza de forma general 
acordes de séptima menor (una tríada menor con una tercera menor 
encima). 

El acorde de séptima dominante se produce de forma natural (es decir, 
diatónicamente) cuando empieza en el quinto grado de la escala mayor. En 
la tonalidad de do, sol 7 se puede construir tocando todas las notas blancas. 
El séptima dominante contiene ese intervalo antiguamente prohibido, el 
tritono, y es el único acorde de una tonalidad que lo hace. El tritono es 
armónicamente el intervalo más inestable que tenemos en la música 
occidental, y lleva consigo por ello una urgencia perceptiva muy fuerte de 
resolver. Como el acorde de séptima dominante también contiene la 
tonalidad escalar más inestable (el grado séptimo, si en la tonalidad de do), 
el acorde «desea» resolverse volviendo a do, la raíz. Es por esta razón por 
lo que el acorde de séptima dominante construido en el quinto grado de una 
escala mayor (el acorde V7, o sol 7 en la tonalidad de do) es el acorde más 
típico, característico y estándar antes de que una composición termine en su 
raíz. Dicho de otro modo, la combinación de sol 7 y do mayor (o sus 
equivalentes en otras tonalidades) nos dan el acorde único más inestable 
seguido por el acorde único más estable; nos da la máxima sensación de 


tensión y resolución que podemos tener. Al final de algunas de las sinfonías 
de Beethoven, cuando la terminación parece prolongarse sin fin, lo que está 
haciendo el maestro es dándonos esa progresión de acordes una y otra y otra 
vez hasta que la pieza se resuelve finalmente en la raíz. 


NOTAS BIBLIOGRÁFICAS 


Los artículos y libros que siguen son algunos de los muchos que he 
consultado. Aunque no se trata en modo alguno de una lista exhaustiva, 
representa las fuentes suplementarias que son más relevantes para las 
cuestiones expuestas en este libro. Se trata de un libro dirigido al no 
especialista y no a mis colegas, por lo que he procurado simplificar temas 
sin excederme en la simplificación. En estas lecturas, y en las lecturas que 
se citan en ellas, se puede hallar un tratamiento más completo y detallado 
del cerebro y la música. Algunas de las obras citadas a continuación están 
escritas para el investigador especialista. He utilizado un asterisco (*) para 
indicar las lecturas más técnicas. La mayoría de las entradas marcadas son 
fuentes primarias y unas cuantas son libros de texto a nivel de graduado. 


INTRODUCCIÓN 


Churchland, P. M. 1986. Matter and Consciousness. Cambridge: MIT Press. [Edición en castellano: 
Materia y conciencia. Introducción contemporánea a la filosofía de la mente, Mizraji, Margarita, 
tr., Editorial Gedisa, S.A., Barcelona, 1992.] 
En el pasaje en el que hablo de que la curiosidad de la humanidad resolvió muchos de los 
mayores misterios científicos, he tomado prestada liberalmente la introducción a esta obra, 
excelente e inspiradora, sobre la filosofía de la mente. 


*Cosmides, L., y J. Tooby. 1989. Evolutionary psychology and the generation of culture, Part I. Case 
study: A computational theory of social exchange. Ethology and Sociobiology 10: 51-97. 
Una introducción excelente al campo de la psicología evolucionista por dos destacados 
especialistas. 


*Deaner, R. O., y C. L. Nunn. 1999. How quickly do brains catch up with bodies? A comparative 
method for detecting evolutionary lag. Proceedings of Biological Sciences 266 (1420): 687-694. 
Un docto artículo reciente sobre el tema del lapso evolutivo, la idea de que nuestros cuerpos y 
mentes están hoy equipados para afrontar el mundo y las condiciones de vida tal como eran hace 
cincuenta mil años, debido a la cantidad de tiempo que hace falta para que las adaptaciones pasen 
a estar codificadas en el genoma humano. 


Levitin, D. J. 2001. Paul Simon: The Grammy Interview. Grammy, septiembre, 42-46. 
Fuente de la cita de Paul Simon sobre la audición del sonido. 


*Miller, G. F. 2000. Evolution of human music through sexual selection. En The Origins of Music, 
compilado por N. L. Wallin, B. Merker y S. Brown, Cambridge: MIT Press. 
Este artículo, escrito por otra figura destacada del campo de la psicología evolutiva, analiza 
muchas de las ideas que se analizan en el capítulo 9, y que se mencionan sólo brevemente en el 
capítulo 1. 


Pareles, J., y P. Romanowski, eds. 1983. The Rolling Stone Encyclopedia of Rock €: Roll. Nueva 
York: Summit Books. 
Adam and the Ants tuvieron veinte centímetros de columna más una foto en esta edición, U2 (ya 
bien conocido y con tres álbumes y el éxito «New Year”s Day») sólo tuvo cuatro pulgadas y 
ninguna foto. 


*Pribram, K. H. 1980. Mind, brain, and consciousness: the organization of competence and conduct. 
En The Psychobiology of Consciousness, compilado por J. M. D. Davidson, R.J. Nueva York: 
Plenum. 


*—: 1982. Brain mechanism in music: prolegomena for a theory of the meaning of meaning. En 
Music, Mind, and Brain, compilado por M. Clynes. Nueva York: Plenum. 
Pribram dio su curso a partir de una colección de artículos y notas que él había compilado. Éstos 
fueron dos de los artículos que leímos. 


Sapolsky, R. M. 1998. Why Zebras Dont Get Ulcers, 3.* ed. Nueva York: Henry Holt and Company. 
[En castellano: ¿Por qué las cebras no tienen úlcera?: La guía del estrés, González Serrano, 
Celina, y Coll Rodríguez, Miguel Ángel, trs., Alianza Editorial, S.A., Madrid, 2008.] 

Un libro excelente y una lectura divertida sobre la ciencia del estrés, y las razones por las que los 
humanos modernos lo padecen; la idea del «lapso evolutivo» que introduzco más ampliamente en 
el capítulo 9 se aborda muy bien en este libro. 


*Shepard, R. N. 1987. Towards a Universal Law of Generalization for psychological Science. 
Science 237 (4820): 1317-1323. 


*—: 1992. The perceptual organization of colors: an adaptation to regularities of the terrestrial 
world? En The Adapted Mind: Evolutionary Psychology and the Generation of Culture, 
compilado por J. H. Barkow, L. Cosmides y J. Tooby. Nueva York: Oxford University Press. 


*—: 1995. Mental universals: Toward a twenty-first century science of mind. En The Science of the 
Mind: 2001 and Beyond, compilado por R. L. Salsa y D. W. Massaro. Nueva York: Oxford 
University Press. 

Tres artículos de Shepard en los que se analiza la evolución de la mente. 


Tooby, J., y L. Cosmides. 2002. Toward mapping the evolved functional organization of mind and 
brain. En Foundations of Cognitive Psychology, compilado por D. J. Levitin. Cambridge: MIT 
Press. 

Otro artículo de esas dos figuras destacadas de la psicología evolutiva, tal vez el más general de 
los dos artículos incluidos aquí. 


CAPÍTULO 1 


*Balzano, G. J. 1986. What are musical pitch and timbre? Music Perception 3 (3): 297-314. 


Un artículo científico sobre los temas relacionados con la investigación de la altura de tono y el 
timbre. 


Berkeley, G. 1734/2004. A Treatise Concerning the Principles of Human Knowledge. Whitefish, 
Mont.: Kessinger Publishing Company. 
El que primero planteó la famosa pregunta «si un árbol cae en el bosque y no hay nadie allí para 
oírlo, ¿produce un sonido?» fue el teólogo y filósofo George Berkeley, obispo de Cloyne, en esta 
obra. 


*Bharucha, J. J. 2002. Neural nets, temporal composites, and tonality. En Foundations of Cognitive 
Psychology: Core Readings, compilado por D. J. Levitin. Cambridge: MIT Press. 
Redes neuronales para la identificación de acordes. 


*Boulanger, R. 2000. The C-Sound Book: Perspectives in Software Synthesis, Sound Design, Signal 
Processing, and Programming. Cambridge: MIT Press. 
Una introducción al sistema/programa informático de síntesis de sonido de mayor uso. El mejor 
libro que yo conozco para gente que quiera aprender a programar ordenadores para hacer música 
y crear timbres de su propia elección. 


Burns, E. M. 1999. Intervals, scales, and tuning. En Psychology of Music, compilado por D. Deutsch. 
San Diego: Academic Press. 
Sobre el origen de las escalas, las relaciones entre las notas, la naturaleza de intervalos y escalas. 


*Chowning, J. 1973. The synthesis of complex audio spectra by means of frequency modulation. 
Journal of the Audio Engineering Society 21: 526-534. 
La síntesis FM, tal como acabaría siendo en los sintetizadores Yamaha DX, se describió por 
primera vez en esta revista profesional. 


Clayson, A. 2002. Edgard Varese. Londres: Sanctuary Publishing, Ltd. 
Fuente de la cita «Música es sonido organizado». 


Dennett, Daniel C. 2005. Show me the Science. The New York Times, 28 de agosto. 
Fuente de la cita «El calor no está hecho de pequeñas cosas calientes». 


Doyle, P. 2005. Echo $: Reverb: Fabricating Space in Popular Music Recording, 1900-1960. 
Middletown, Conmn. 
Un examen amplio y docto de la fascinación de la industria discográfica con el espacio y la 
creación de ambientes artificiales. 


Dwyer, T. 1971. Composing with Tape Recorders: Musique Concrete. Nueva York: Oxford 
University Press. 
Para información sobre los antecedentes de la musique concrete de Schaeffer, Dhomon, 
Normandeau y otros. 


*Grey, J. M. 1975. An exploration of musical timbre using computer-based techniques for analysis, 
synthesis, and perceptual scaling. Ph.D. Thesis, Music, Center for Computer Research in Music 
and Acoustics, Stanford University, Stanford, California. 

El artículo más influyente sobre enfoques modernos del estudio del timbre. 


*Janata, P. 1997. Electrophysiological studies of auditory contexts. Dissertation Abstraéis 
International: Section B: The Sciences and Engineering, Universidad de Oregón. 
Contiene los experimentos que muestran que el culículo inferior de la lechuza restaura la nota 
fundamental que falta. 


*Krumhansl, C. L. 1990. Cognitive Foundations of Musical Pitch. Nueva York: Oxford University 
Press. 


*=—: 1991. Music psychology: Tonal structures in perception and memory. Annual Review of 
Psychology 42: 277-303. 


*—: 2000. Rhythm and pitch in music cognition. Psychological Bulletin 126 (1): 159-179. 


*—: 2002. Music: A link between cognition and emotion. Current Directions in Psychological 
Science 11 (2): 45-50. 
Krumhansl es uno de los principales científicos que trabajan en la cognición y la percepción 
musical; estos artículos, y la monografía, aportan las bases del campo, y en particular el concepto 
de jerarquías tonales, la dimensionalidad del tono y la representación mental de éste. 


*Kubovy, M. 1981. Integral and separable dimensions and the theory of indispensable attributes. En 
Perceptual Organization, compilado por M. Kubovy y J. Pomerantz. Hillsdale, N.J.: Erlbaum. 
Fuente del concepto de dimensiones separables en música. 


Levitin, D. J. 2002. Memory for musical attributes. En Foundations of Cognitive Psychology: Core 
Readings, compilado por D. J. Levitin. Cambridge: MIT Press. 
Fuente de la enumeración de los ocho atributos perceptuales diferentes de un sonido. 


*McAdams, S., J. W. Beauchamp y S. Meneguzzi. 1999. Discrimination of musical instrument 
sounds resynthesized with simplified spectrotemporal parameters. Journal of the Acoustical 
Society of America 105 (2): 882-897. 


McAdanns, S., y E. Bigand. 1993. Introduction to auditory cognition. En Thinking in Sound: The 
Cognitive Psychology of Audition, compilado por S. McAdams y E. Bigand. Oxford: Clarendon 
Press. 


*McAdams, S., y J. Cunible. 1992. Perception of timbral analogies. Philosophical Transactions of 
the Royal Society of London, B 336: 383-389. 


*McAdams, S., S. Winsberg, S. Donnadieu y G. De Soete. 1995. Perceptual scaling of synthesized 
musical timbres: Common dimensions, specificities, and latent subject classes. Psychological 
Research/Psychologische Forschung 58 (3): 177-192. 

McAdanms es el investigador más destacado del mundo en el estudio del timbre, y estos cuatro 
artículos aportan una visión general de lo que sabemos actualmente sobre su percepción. 


Newton, I. 1730/1952. Opticks: or, A Treatise of the Reflections, Refractions, Inflections, and 
Colours of Light. Nueva York: Dover. 
Fuente de la observación de Newton de que las ondas luminosas no son en sí mismas coloreadas. 


*Oxenham, A. J., J. G. W. Bernstein y H. Penagos. 2004. Correct tonotopic representation is 
necessary for complex pitch perception. Proceedings of the National Academy of Sciences 101: 
1421-1425. 

Sobre representaciones tonotópicas del tono en el sistema auditivo. 


Palmer, S. E. 2000. Vision: From Photons to Phenomenology. Cambridge: MIT Press. 
Una excelente introducción a la ciencia cognitiva y a la ciencia de la visión, a un nivel de 
pregraduado. He de añadir que Palmer y yo somos colaboradores y que hice algunas aportaciones 
a este libro. Fuente para los diferentes atributos de los estímulos visuales. 


Pierce, J. R. 1992. The Science of Musical Sound, edición revisada. San Francisco: W. H. Freeman. 
[En castellano: Los sonidos de la música, Lewin-Richter, Andrés, tr., Prensa Científica, S.A., 
Barcelona, 1990.] 

Una fuente magnífica para el lego culto que quiera comprender la física del sonido, los 
armónicos, las escalas, etc. He de añadir que Pierce fue en vida profesor mío y amigo. 


Rossing, T. D. 1990. The Science of Sound, 2.* ed. Reading, Mass.: Addison-Wesley Publishing. 
Otra fuente magnífica para la física del sonido, los armónicos, las escalas, etc.; apropiado para 
pregraduados. 


Schaeffer, Pierre. 1967. La musique concrete. París: Presses Universitaires de France. 


—: 1968. Traité des objets musicaux. París: Le Seuil. [En castellano: Tratado de los objetos 
musicales, Cabezón de Diego, Araceli (tr.) Alianza Editorial, S.A., Madrid ,1988] 
En el primero se exponen los principios de la musique concrete y en el segundo la obra maestra 
de Schaeffer sobre la teoría del sonido. Por desgracia aún no hay ninguna traducción al inglés. 


Schmeling, P. 2005. Berklee Music Theory Book 1. Boston: Berklee Press. 
Yo aprendí teoría de la música en Berklee College, y éste es el primer volumen de su serie. 
Adecuado para el que quiera aprender por su cuenta, cubre todo lo básico. 


*Schroeder, M. R. 1962. Natural sounding artificial reverberation. Journal of the Audio Engineering 
Society 10 (3): 219-233. 
El artículo fundamental sobre la creación de la reverberación artificial. 


Scorsese, Martin. 2005. No Direction Home. USA: Paramount. 
Fuente de las informaciones sobre el abucheo a Bob Dylan en el Festival Folk de Newport. 


Sethares, W. A. 1997. Tuning, Timbre, Spectrum, Scale. Londres: Springer. 
Una introducción rigurosa a la física de la música y de los sonidos musicales. 


*Shamma, S., y D. Klein. 2000. The case of the missing pitch templates: How harmonic templates 
emerge in the early auditory system. Journal of the Acoustical Society of America 107 (5): 2631- 
2644. 


*Shanuna, S. A. 2004. Topographic organization is essential for pitch perception. Proceedings of the 
National Academy of Sciences 101: 1114-1115. 
Sobre representaciones tonotópicas sobre el tono en el sistema auditivo. 


*Smith, J. O. 1992. Physical modeling using digital waveguides. Computer Music Journal 16 (4): 74- 
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El artículo que introdujo la síntesis de las guías de onda. 


Surmani, A., K. F. Surmani y M. Manus. 2004. Essentials of Music Theory: A Complete Self-Study 
Course for All Musicians. Van Nuys, Calif.: Alfred Publishing Company. 
Otra excelente y guía autodidáctica sobre teoría de la música. 


Taylor, C. 1992. Exploring Music: The Science and Technology of Tones and Tunes. Bristol: Institute 
of Physics Publishing. 
Otro excelente texto de nivel universitario sobre la física del sonido. 


Trehhub, S. E. 2003. Musical predispositions in infancy. En The Cognitive Neuroscience of Music, 
compilado por 1. Peretz y R. J. Zatorre. Oxford: Oxford University Press. 


*Vástfjáll, D., P. Larsson y M. Kleiner. 2002. Emotional and auditory virtual environments: Affect- 
based judgments of music reproduced with virtual reverberation times. CyberPsychology 8 
Behavior 5 (1): 19-32. 

Un docto artículo reciente sobre los efectos de la reverberación en la reacción emotiva. 


CAPÍTULO 2 


*Bregman, A. S. 1990. Auditory Scene Analysis. Cambridge: MIT Press. 


La obra definitiva sobre principios de agrupación general auditiva. 


Clarke, E. F. 1999. Rhythm and timing in music. En The Psychology of Music, compilado por D. 
Deutsch. San Diego: Academic Press. 
Un artículo a nivel de pregraduado sobre la psicología de la percepción del ritmo en la música, 
fuente de la cita de Eric Clarke. 


*Ehrenfels, C. von. 1890/1988. On «Gestalt qualities». En Foundations of Gestalt Theory, compilado 
por B. Smith. Munich: Philosophia Verlag. 
Sobre la fundación de la psicología de la Gestalt y el interés de los psicólogos de la Gestalt por la 
melodía. 


Elias, L. J., y D. M. Saucier. 2006. Neuropsychology: Clinical and Experimental Foundations. 
Boston: Pearson. 
Manual de introducción a los conceptos fundamentales de la neuroanatomía y las funciones de las 
diversas regiones del cerebro. 


*Fishman, Y. I., D. H. Reser, J. C. Arezzo y M. Steinschneider. 2000. Complex tone processing in 
primary auditory cortex of the awake monkey. I. Neural ensemble correlates of roughness. 
Journal of the Acoustical Society of America 108: 235-246. 

La base fisiológica de la percepción de la consonancia y la disonancia. 


Gilmore, Mikal. 2005. Lennon lives forever: Twenty-five years after his death, his music and 
message endure. Rolling Stone, 15 de diciembre. 
Fuente de la cita de John Lennon. 


Helmholtz, H. L. F. 1885/1954. On the Sensations of Tone, 2.* edición revisada. Nueva York: Dover. 
Inferencia inconsciente. 


Lerdahl, Fred. 1983. A Generative Theory of Tonal Music. Cambridge: MIT Press. [En castellano: 
Teoría generativa de la música tonal, González Castelao, Juan, tr., Ediciones Akal, S.A., Tres 
Cantos, 2003.] 

La exposición de los principios de la agrupación auditiva en música que ha ejercido mayor 
influencia. 


*Levitin, D. J., y P. R. Cook. 1996. Memory for musical tempo: Additional evidence that auditory 
memory is absolute. Perception and Psychophysics 58: 927-935. 
Éste es el artículo mencionado en el texto en el que Cook y yo pedimos a la gente que cantara sus 
canciones de rock favoritas y reprodujeron el tempo con una gran exactitud. 


Luce, R. D. 1993. Sound and Hearing: A Conceptual Introduction. Hillsdale, N.J.: Erlbaum. 
Manual sobre el oído y la audición que incluye fisiología del oído, intensidad del sonido, 
percepción del tono, etc. 


*Mesulam, M.-M. 1985. Principles of Behavioral Neurology. Philadelphia: F. A. Davis Company. 
Manual avanzado para graduados que sirve como introducción a conceptos fundamentales de 
neuroanatomía y de las funciones de las diversas regiones del cerebro. 


Moore, B. C. J. 1982. An Introduction to the Psychology of Hearing, 2.* ed. Londres: Academic 
Press. 


—: 2003. An Introduction to the Psychology of Hearing, 5.* ed. Amsterdam: Academic Press. 
Manuales sobre el oído y la audición que incluyen fisiología del oído, intensidad del sonido, 
percepción del tono, etc. 


Palmer, S. E. 2002. Organizing objects and scenes. En Foundations of Cognitive Psychology: Core 
readings, compilado por D. J. Levitin. Cambridge: MIT Press. 
Sobre los principios de agrupación visual de la Gestalt. 


Stevens, S. S., y F. Warshofsky. 1965. Sound and Hearing, compilado por R. Dubos, H. Margenau y 
C. P. Snow. Life Science Library. Nueva York: Time Incorporated. 
Una buena introducción a los principios de la audición y la percepción auditiva para el lector 
general. 


*Tramo, M. J., P. A. Cariani, B. Delgutte y L. D. Braida. 2003. Neurobiology of harmony perception. 
En The Cognitive Neuroscience of Music, compilado por I. Peretz y R. J. Zatorre. Nueva York: 
Oxford University Press. 

La base fisiológica de la percepción de la consonancia y de la disonancia. 


Yost, W. A. 1994. Fundamentals of Hearing: An Introduction, 3.* ed. San Diego: Academic Press, 
Inc. 
Manual sobre la percepción de la intensidad del sonido, el tono y la audición. 


Zimbardo, P. G., y R. J. Gerrig. 2002. Perception. En Foundations of Cognitive Psychology, 
compilado por D. J. Levitin. Cambridge: MIT Press. 
Los principios gestálticos de la agrupación. 


CAPÍTULO 3 


Bregman, A. S. 1990. Auditory Scene Analysis. Cambridge: MIT Press. 
Un recorrido por el timbre y otros principios de agrupación auditiva. Mi analogía sobre el 
tímpano como una funda de almohadón estirada sobre un cubo toma prestado liberalmente de una 
analogía distinta que se propone en este libro. 


*Chomsky, N. 1957. Syntactic Structures. La Haya, Holanda: Mouton. 
Sobre el carácter innato de una capacidad lingilística en el cerebro humano. 


Crick, F. H. C. 1995. The Astonishing Hypothesis: The Scientific Search for the Soul. Nueva York: 
Touchstone/Simon € Schuster. [En castellano: La búsqueda científica del alma: una 
revolucionaria hipótesis, Páez de la Cadena Tortosa, Francisco, tr., Editorial Debate, Barcelona, 
1994.] 

La idea de que toda la conducta humana se puede explicar por la actividad del cerebro y de las 
neuronas. 


Dennett, D. C. 1991. Consciousness Explained. Boston: Little, Brown and Company. [En castellano: 
La conciencia explicada: una teoría interdisciplinar, Balari Ravera, Sergio, tr., Ediciones Paidós 
Ibérica, S.A., Barcelona, 1995.] 

Sobre las ilusiones de la experiencia consciente y del cerebro que ponen al día la información. 


—: 2002. Can machines think? En Foundations of Cognitive Psychology: Core Readings, compilado 
por D. J. Levitin. Cambridge: MIT Press. 


—: 2002. Where am I? En Foundations of Cognitive Psychology: Core Readings, compilado por D. 
J. Levitin. Cambridge: MIT Press. 
Estos dos artículos abordan temas básicos del cerebro como computadora y la idea filosófica del 
funcionalismo; «Can machines think?» resume también el test de Turing sobre la inteligencia y 
sus fuerzas y debilidades. 


*Friston, K. J. 2005. Models of brain function in neuroimaging. Annual Review of Psychology 56: 
57-87. 
Una panorámica técnica de los métodos de investigación para el análisis de datos de imágenes del 
cerebro por los inventores del SPM, un paquete estadístico de amplio uso para los datos MRIf. 


Gazzaniga, M. S., R. B. Ivry y G. Mangun. 1998. Cognitive Neuroscience. Nueva York: Norton. 
Divisiones funcionales del cerebro; divisiones básicas en lóbulos, hitos anatómicos principales; 
texto para pregraduados. 


Gertz, S. D., y R. Tadmor. 1996. Liebman's Neuroanatomy Made Easy and Understandable, 5.* ed. 
Gaithersburg, Md.: Aspen. 
Una introducción a la neuroanatomía y a las principales regiones del cerebro. 


Gregory, R. I. 1986. Odd Perceptions. Londres: Routledge. 
Sobre la percepción como inferencia. 


*Griffiths, T. D., S. Uppenkamp, I. Johnsrude, O. Josephs y R. D. Patterson. 2001. Encoding of the 
temporal regularity of sound in the human brainstem. Nature Neuroscience 4 (6): 633-637. 


*Griffiths, T. D., y J. D. Warren. 2002. The planum temporale as a computational hub. Trends in 
Neuroscience 25 (7): 348-353. 
Obra reciente sobre el procesamiento del sonido en el cerebro de Griffiths, uno de los 
investigadores más estimados de la actual generación de científicos del cerebro que estudian 
procesos auditivos. 


*Hickok, G., B. Buchsbaum, C. Humphries y T. Muftuler. 2003. Auditory-motor interaction revealed 
by fMRI: Speech, music, and working memory in area Spt. Journal of Cognitive Neuroscience 15 
(5): 673-682. 

Fuente primordial para la activación musical en una región del cerebro de la parte posterior de la 
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